zoukankan      html  css  js  c++  java
  • 基础学习笔记之opencv(16):grabcut使用例程

      前言

      grabcut是在graph cut基础上改进的一种图像分割算法,它同样是基于图割理论的,关于图割的简单介绍可以参考本人前面的博文:一些知识点的初步理解_8(Graph Cuts,ing...) 。稍微看了下grabcut方面的论文,论文中一般都是在graph cut上作改进,比如说引入了GMM模型等。同graph cut一样,在使用grabcut是也是需要人机交互的,即人工先给定一定区域的目标或者背景,然后送给grabcut算法来分割。通过实验发现,其分割效果一般般,且分割速度比较慢,一张普通大小的图片差不多需要1s左右的时间,

      实验说明

      因为在使用该算法的过程中需要人机交互,所以需要用到很多鼠标键盘的操作,因此这些GUI操作的逻辑关系一定要处理好。其中最主要的GUI设计就在鼠标键盘响应函数中,在设置关于图片的鼠标键盘响应函数时,其函数的参数必须满足一定的类型,如下所示:

      mouseClick (int event, int x, int y, int flags, void* param); 

      其中event是 CV_EVENT_*变量之一; x和y是鼠标指针在图像坐标系的坐标,并不是整个窗口的坐标;  flags是CV_EVENT_FLAG的组合,  即表示所有的按键,一般情况下是固定的;  param是用户定义的传递到cvSetMouseCallback函数调用的参数,这通常在回调函数中都有类似这种功能的的参数。

       Grabcut在opencv中核心算法函数为:
         void cv::grabCut( const Mat& img, Mat& mask, Rect rect, Mat& bgdModel, Mat& fgdModel, int iterCount, int mode )
      这里引用网友的博文学习OpenCV——grabcut来解释该函数的用法:
      img——待分割的源图像,必须是8位3通道(CV_8UC3)图像,在处理的过程中不会被修改;
      mask——掩码图像,如果使用掩码进行初始化,那么mask保存初始化掩码信息;在执行分割的时候,也可以将用户交互所设定的前景与背景保存到mask中,然后再传入grabCut函数;在处理结束之后,mask中会保存结果。mask只能取以下四种值:
      GCD_BGD(=0),背景;
      GCD_FGD(=1),前景;
      GCD_PR_BGD(=2),可能的背景;
      GCD_PR_FGD(=3),可能的前景。
      如果没有手工标记GCD_BGD或者GCD_FGD,那么结果只会有GCD_PR_BGD或GCD_PR_FGD;
      rect——用于限定需要进行分割的图像范围,只有该矩形窗口内的图像部分才被处理;
      bgdModel——背景模型,如果为null,函数内部会自动创建一个bgdModel;bgdModel必须是单通道浮点型(CV_32FC1)图像,且行数只能为1,列数只能为13x5;
      fgdModel——前景模型,如果为null,函数内部会自动创建一个fgdModel;fgdModel必须是单通道浮点型(CV_32FC1)图像,且行数只能为1,列数只能为13x5;
      iterCount——迭代次数,必须大于0;
      mode——用于指示grabCut函数进行什么操作,可选的值有:
      GC_INIT_WITH_RECT(=0),用矩形窗初始化GrabCut;
      GC_INIT_WITH_MASK(=1),用掩码图像初始化GrabCut;
      GC_EVAL(=2),执行分割。

      实验结果

      分割前的原始图如下所示:

      

      由于本次实验是一个人机交互的过程,需要人的手工输入前景点和背景点,或者可能的前景点和背景点,本次实验中,本人只用鼠标画出了一些前景点(Shift+鼠标左键+鼠标移动)和一些背景点(Ctrl+鼠标左键+鼠标移动),如下图所示(其中红色的为前景点,蓝色的为背景点,外面的绿色框为图像分割的区域):

      

      

      一次grabcut迭代后分割的结果:

      

      若干次迭代后分割的结果:

      

      另外,关于本次实验的操作方法可以参考代码中函数的help内容,里面有详细的介绍。

      实验代码及注释:

       本次实验代码来源为opencv自带的c++ sample。

      crabcut.cpp:

    #include "opencv2/highgui/highgui.hpp"
    #include "opencv2/imgproc/imgproc.hpp"
    
    #include <iostream>
    
    using namespace std;
    using namespace cv;
    
    static void help()
    {
        cout << "\nThis program demonstrates GrabCut segmentation -- select an object in a region\n"
                "and then grabcut will attempt to segment it out.\n"
                "Call:\n"
                "./grabcut <image_name>\n"
            "\nSelect a rectangular area around the object you want to segment\n" <<
            "\nHot keys: \n"
            "\tESC - quit the program\n"
            "\tr - restore the original image\n"
            "\tn - next iteration\n"
            "\n"
            "\tleft mouse button - set rectangle\n"
            "\n"
            "\tCTRL+left mouse button - set GC_BGD pixels\n"
            "\tSHIFT+left mouse button - set CG_FGD pixels\n"
            "\n"
            "\tCTRL+right mouse button - set GC_PR_BGD pixels\n"
            "\tSHIFT+right mouse button - set CG_PR_FGD pixels\n" << endl;
    }
    
    const Scalar RED = Scalar(0,0,255);
    const Scalar PINK = Scalar(230,130,255);
    const Scalar BLUE = Scalar(255,0,0);
    const Scalar LIGHTBLUE = Scalar(255,255,160);
    const Scalar GREEN = Scalar(0,255,0);
    
    const int BGD_KEY = CV_EVENT_FLAG_CTRLKEY;  //Ctrl键
    const int FGD_KEY = CV_EVENT_FLAG_SHIFTKEY; //Shift键
    
    static void getBinMask( const Mat& comMask, Mat& binMask )
    {
        if( comMask.empty() || comMask.type()!=CV_8UC1 )
            CV_Error( CV_StsBadArg, "comMask is empty or has incorrect type (not CV_8UC1)" );
        if( binMask.empty() || binMask.rows!=comMask.rows || binMask.cols!=comMask.cols )
            binMask.create( comMask.size(), CV_8UC1 );
        binMask = comMask & 1;  //得到mask的最低位,实际上是只保留确定的或者有可能的前景点当做mask
    }
    
    class GCApplication
    {
    public:
        enum{ NOT_SET = 0, IN_PROCESS = 1, SET = 2 };
        static const int radius = 2;
        static const int thickness = -1;
    
        void reset();
        void setImageAndWinName( const Mat& _image, const string& _winName );
        void showImage() const;
        void mouseClick( int event, int x, int y, int flags, void* param );
        int nextIter();
        int getIterCount() const { return iterCount; }
    private:
        void setRectInMask();
        void setLblsInMask( int flags, Point p, bool isPr );
    
        const string* winName;
        const Mat* image;
        Mat mask;
        Mat bgdModel, fgdModel;
    
        uchar rectState, lblsState, prLblsState;
        bool isInitialized;
    
        Rect rect;
        vector<Point> fgdPxls, bgdPxls, prFgdPxls, prBgdPxls;
        int iterCount;
    };
    
    /*给类的变量赋值*/
    void GCApplication::reset()
    {
        if( !mask.empty() )
            mask.setTo(Scalar::all(GC_BGD));
        bgdPxls.clear(); fgdPxls.clear();
        prBgdPxls.clear();  prFgdPxls.clear();
    
        isInitialized = false;
        rectState = NOT_SET;    //NOT_SET == 0
        lblsState = NOT_SET;
        prLblsState = NOT_SET;
        iterCount = 0;
    }
    
    /*给类的成员变量赋值而已*/
    void GCApplication::setImageAndWinName( const Mat& _image, const string& _winName  )
    {
        if( _image.empty() || _winName.empty() )
            return;
        image = &_image;
        winName = &_winName;
        mask.create( image->size(), CV_8UC1);
        reset();
    }
    
    /*显示4个点,一个矩形和图像内容,因为后面的步骤很多地方都要用到这个函数,所以单独拿出来*/
    void GCApplication::showImage() const
    {
        if( image->empty() || winName->empty() )
            return;
    
        Mat res;
        Mat binMask;
        if( !isInitialized )
            image->copyTo( res );
        else
        {
            getBinMask( mask, binMask );
            image->copyTo( res, binMask );  //按照最低位是0还是1来复制,只保留跟前景有关的图像,比如说可能的前景,可能的背景
        }
    
        vector<Point>::const_iterator it;
        /*下面4句代码是将选中的4个点用不同的颜色显示出来*/
        for( it = bgdPxls.begin(); it != bgdPxls.end(); ++it )  //迭代器可以看成是一个指针
            circle( res, *it, radius, BLUE, thickness );
        for( it = fgdPxls.begin(); it != fgdPxls.end(); ++it )  //确定的前景用红色表示
            circle( res, *it, radius, RED, thickness );
        for( it = prBgdPxls.begin(); it != prBgdPxls.end(); ++it )
            circle( res, *it, radius, LIGHTBLUE, thickness );
        for( it = prFgdPxls.begin(); it != prFgdPxls.end(); ++it )
            circle( res, *it, radius, PINK, thickness );
    
        /*画矩形*/
        if( rectState == IN_PROCESS || rectState == SET )
            rectangle( res, Point( rect.x, rect.y ), Point(rect.x + rect.width, rect.y + rect.height ), GREEN, 2);
    
        imshow( *winName, res );
    }
    
    /*该步骤完成后,mask图像中rect内部是3,外面全是0*/
    void GCApplication::setRectInMask()
    {
        assert( !mask.empty() );
        mask.setTo( GC_BGD );   //GC_BGD == 0
        rect.x = max(0, rect.x);
        rect.y = max(0, rect.y);
        rect.width = min(rect.width, image->cols-rect.x);
        rect.height = min(rect.height, image->rows-rect.y);
        (mask(rect)).setTo( Scalar(GC_PR_FGD) );    //GC_PR_FGD == 3,矩形内部,为可能的前景点
    }
    
    void GCApplication::setLblsInMask( int flags, Point p, bool isPr )
    {
        vector<Point> *bpxls, *fpxls;
        uchar bvalue, fvalue;
        if( !isPr ) //确定的点
        {
            bpxls = &bgdPxls;
            fpxls = &fgdPxls;
            bvalue = GC_BGD;    //0
            fvalue = GC_FGD;    //1
        }
        else    //概率点
        {
            bpxls = &prBgdPxls;
            fpxls = &prFgdPxls;
            bvalue = GC_PR_BGD; //2
            fvalue = GC_PR_FGD; //3
        }
        if( flags & BGD_KEY )
        {
            bpxls->push_back(p);
            circle( mask, p, radius, bvalue, thickness );   //该点处为2
        }
        if( flags & FGD_KEY )
        {
            fpxls->push_back(p);
            circle( mask, p, radius, fvalue, thickness );   //该点处为3
        }
    }
    
    /*鼠标响应函数,参数flags为CV_EVENT_FLAG的组合*/
    void GCApplication::mouseClick( int event, int x, int y, int flags, void* )
    {
        // TODO add bad args check
        switch( event )
        {
        case CV_EVENT_LBUTTONDOWN: // set rect or GC_BGD(GC_FGD) labels
            {
                bool isb = (flags & BGD_KEY) != 0,
                     isf = (flags & FGD_KEY) != 0;
                if( rectState == NOT_SET && !isb && !isf )//只有左键按下时
                {
                    rectState = IN_PROCESS; //表示正在画矩形
                    rect = Rect( x, y, 1, 1 );
                }
                if ( (isb || isf) && rectState == SET ) //按下了alt键或者shift键,且画好了矩形,表示正在画前景背景点
                    lblsState = IN_PROCESS;
            }
            break;
        case CV_EVENT_RBUTTONDOWN: // set GC_PR_BGD(GC_PR_FGD) labels
            {
                bool isb = (flags & BGD_KEY) != 0,
                     isf = (flags & FGD_KEY) != 0;
                if ( (isb || isf) && rectState == SET ) //正在画可能的前景背景点
                    prLblsState = IN_PROCESS;
            }
            break;
        case CV_EVENT_LBUTTONUP:
            if( rectState == IN_PROCESS )
            {
                rect = Rect( Point(rect.x, rect.y), Point(x,y) );   //矩形结束
                rectState = SET;
                setRectInMask();
                assert( bgdPxls.empty() && fgdPxls.empty() && prBgdPxls.empty() && prFgdPxls.empty() );
                showImage();
            }
            if( lblsState == IN_PROCESS )   //已画了前后景点
            {
                setLblsInMask(flags, Point(x,y), false);    //画出前景点
                lblsState = SET;
                showImage();
            }
            break;
        case CV_EVENT_RBUTTONUP:
            if( prLblsState == IN_PROCESS )
            {
                setLblsInMask(flags, Point(x,y), true); //画出背景点
                prLblsState = SET;
                showImage();
            }
            break;
        case CV_EVENT_MOUSEMOVE:
            if( rectState == IN_PROCESS )
            {
                rect = Rect( Point(rect.x, rect.y), Point(x,y) );
                assert( bgdPxls.empty() && fgdPxls.empty() && prBgdPxls.empty() && prFgdPxls.empty() );
                showImage();    //不断的显示图片
            }
            else if( lblsState == IN_PROCESS )
            {
                setLblsInMask(flags, Point(x,y), false);
                showImage();
            }
            else if( prLblsState == IN_PROCESS )
            {
                setLblsInMask(flags, Point(x,y), true);
                showImage();
            }
            break;
        }
    }
    
    /*该函数进行grabcut算法,并且返回算法运行迭代的次数*/
    int GCApplication::nextIter()
    {
        if( isInitialized )
            //使用grab算法进行一次迭代,参数2为mask,里面存的mask位是:矩形内部除掉那些可能是背景或者已经确定是背景后的所有的点,且mask同时也为输出
            //保存的是分割后的前景图像
            grabCut( *image, mask, rect, bgdModel, fgdModel, 1 );
        else
        {
            if( rectState != SET )
                return iterCount;
    
            if( lblsState == SET || prLblsState == SET )
                grabCut( *image, mask, rect, bgdModel, fgdModel, 1, GC_INIT_WITH_MASK );
            else
                grabCut( *image, mask, rect, bgdModel, fgdModel, 1, GC_INIT_WITH_RECT );
    
            isInitialized = true;
        }
        iterCount++;
    
        bgdPxls.clear(); fgdPxls.clear();
        prBgdPxls.clear(); prFgdPxls.clear();
    
        return iterCount;
    }
    
    GCApplication gcapp;
    
    static void on_mouse( int event, int x, int y, int flags, void* param )
    {
        gcapp.mouseClick( event, x, y, flags, param );
    }
    
    int main( int argc, char** argv )
    {
    
        string filename = "test.jpg";
        Mat image = imread( filename, 1 );
        if( image.empty() )
        {
            cout << "\n Durn, couldn't read image filename " << filename << endl;
            return 1;
        }
    
        help();
    
        const string winName = "image";
        cvNamedWindow( winName.c_str(), CV_WINDOW_AUTOSIZE );
        cvSetMouseCallback( winName.c_str(), on_mouse, 0 );
    
        gcapp.setImageAndWinName( image, winName );
        gcapp.showImage();
    
        for(;;)
        {
            int c = cvWaitKey(0);
            switch( (char) c )
            {
                    case '\x1b':
                        cout << "Exiting ..." << endl;
                        goto exit_main;
                    case 'r':
                        cout << endl;
                        gcapp.reset();
                        gcapp.showImage();
                        break;
                    case 'n':
                        int iterCount = gcapp.getIterCount();
                        cout << "<" << iterCount << "... ";
                        int newIterCount = gcapp.nextIter();
                        if( newIterCount > iterCount )
                        {
                            gcapp.showImage();
                            cout << iterCount << ">" << endl;
                        }
                        else
                            cout << "rect must be determined>" << endl;
                        break;
            }
        }
    
    exit_main:
        cvDestroyWindow( winName.c_str() );
        return 0;
    }

      实验总结:本次实验测试了下opencv自带的grabcut算法,其效果还算可以,不过需要人工交互提供分割信息,比较难以接受的是其分割速度太慢,不能实时处理。

      参考文献:

         学习OpenCV——grabcut

         Opencv2.1 的grabcut使用问题

       一些知识点的初步理解_8(Graph Cuts,ing...)

  • 相关阅读:
    maven项目部署到tomcat中没有classe文件的问题汇总
    Tomcat远程调试模式及利用Eclipse远程链接调试
    FastDFS 常见问题
    Linux Crontab 定时任务 命令详解
    EChart 关于图标控件的简单实用
    java 通过zxing生成二维码
    Mybatis typeAliases别名
    Mybatis 实现手机管理系统的持久化数据访问层
    Mybatis 实现传入参数是表名
    Mybatis关于like的字符串模糊处理
  • 原文地址:https://www.cnblogs.com/tornadomeet/p/2763271.html
Copyright © 2011-2022 走看看