zoukankan      html  css  js  c++  java
  • OpenCV 数字验证码识别

    更新后代码下载链接在此!

    !!

    点我下载
    本文针对OpenCv入门人士。由于我也不是专门做图像的,仅仅是为了完毕一次模式识别的小作业。

    主要完毕的功能就是自己主动识别图片中的数字。图片包含正常图片,有划痕图像和有噪点图像。

    分别例如以下

    正常图像

    有划痕

    有噪点

    先上图。看识别效果!

    这里写图片描写叙述

    接下来開始来点干货了:

    • opencv的安装与配置:这个要是展开讲能够再写一篇博文了,我当时什么都不会配个opencv麻烦死了,最后參考网上studio2012的配置方法成功了,在此略过。看到这里你的opencv还不能用的话,赶紧别往下看了,先把opencv配好再来吧!
    • opencv基本图片操作:
      • 由于opencv有2.0 和 3.0 的版本号差别,所以网上搜到的函数或类型都是两种格式,建议用新版的,什么impImage* 类型的都是2.0版本号的写法。我所有使用的是Mat。一定要统一好,不要一会新的一会旧的,会报错的。

      • 读图片imread,显示imshow,等待waitKey等等。这些要先熟悉
      • opencv的强大之处在于差点儿所有的图像操作它都有现成的函数可供调用,非常方便。多谷歌,一定会有函数已经实现了你想完毕的功能。

    • 二值化:不论是原图还是有划痕或噪点的图,背景都不干净。这对识别的影响还是挺不好的,所以要先二值化。把黑白像素点区分的开一些。可是图片右側明显要比左側更暗,所以在阈值选取的时候比較难办,非常难用一个固定的值将两部分图像都二值化得非常理想,所以就用到了逼格更高的自适应二值化(adaptiveThreshold),tips:二值化前先直方图均衡一下效果会更好。

    • 中值滤波:针对有噪点和有划痕的图像,中值滤波是非常好的处理方案。中值的參数可调,能够非常好的消除噪音的影响。缺点就是參数不好调啊,调的想死。。

    • 模板匹配:模板的来源能够是自己从待识别的图片中抠图,只是我们作业提供了模板图片,所以这一步就能够省掉了。opencv提供了非常强大的matchTemplate函数。能够将给定图片与模板依照你规定的计算方法计算一个类似度的值。并将相应的坐标存储下来。你须要做的仅仅是将值比較大(或小,与你规定计算类似度的函数有关)的图像框出来就可以
    • 窗体扫描:为了提高识别率。我设定了一个窗体对原图进行扫描,扫描窗体的移动设定了一点规则,就是假设前一个窗体没有匹配到数字就微调窗体位置,假设匹配到数字就将窗体左轴移动到匹配到的数字的右側。再反复扫描。

    基本干货就这么多了。剩下的就是不断的调參数和扫描窗体的位置了,这种方法的缺陷就是针对不同的图片。參数和扫描窗都要变,比方来一张一行或三行的数字,那就必须改动扫描窗体的函数了。还有每一步的步长之类的。还是相当蛋疼的!

    以下是部分核心代码

    预处理。包含自适应二值化和中值滤波

    void preProcess(){          //自适应二值化&中值滤波
            Mat out;
            //自适应二值化
            adaptiveThreshold(source, source, 255, CV_ADAPTIVE_THRESH_MEAN_C, CV_THRESH_BINARY, adaptiveBiSize, adaptiveBiParam); 
            //中值滤波
            namedWindow("binary");
            imshow("binary",source);
            waitKey(0);
            medianBlur( source, out, medianBlurSize);
            namedWindow("medianblur");
            imshow("medianblur",out);
            waitKey(0);
            source = out;
            srcResult = out;  //用来显示
        }

    匹配

    bool match(Mat src){
            int srcW,srcH,templatW, templatH, curtemplatW,curtemplatH,resultH, resultW; 
            Mat templat,result;
            srcW = src.cols;  
            srcH = src.rows;
            double currentMin = 1;
            int    currentIndex=0;
            double minValue, maxValue;  
            Point minLoc, maxLoc,matchLoc; 
            /*
            ** 类似度计算方法
            ** 0:CV_TM_SQDIFF        平方差匹配法。最好的匹配值为0;匹配越差,匹配值越大
            ** 1:CV_TM_SQDIFF_NORMED 归一化平方差匹配法
            ** 2:CV_TM_CCORR         相关匹配法:该方法採用乘法操作;数值越大表明匹配程度越好
            ** 3:CV_TM_CCORR_NORMED  归一化相关匹配法
            ** 4:CV_TM_CCOEFF        相关系数匹配法:1表示完美的匹配。-1表示最差的匹配。
            ** 5:CV_TM_CCOEFF_NORMED 归一化相关系数匹配法
            */
            int methodType=1;
            //循环推断8个数字哪个数字模板最为接近被測试图像
            for (int i=0;i<8;i++){
                templat = templatVec[i];
                templatW = templat.cols;  
                templatH = templat.rows;  
                if(srcW < templatW || srcH < templatH)  
                {  
                    cout <<"模板不能比原图像大" << endl;  
                    return 0;  
                }  
                resultW = srcW - templatW + 1;  
                resultH = srcH - templatH + 1;  
                result = cvCreateImage(cvSize(resultW, resultH), 1, 1);  
    
                matchTemplate(src, templat, result, methodType);   
    
                minMaxLoc(result, &minValue, &maxValue, &minLoc, &maxLoc,Mat() );
                //假设比当前最小还小,则储存该值,下标和坐标
                if (minValue<currentMin){
                    currentMin = minValue;
                    currentIndex=i;
                    matchLoc.x=minLoc.x+window_x;
                    matchLoc.y=minLoc.y+window_y;
                    curtemplatW = templatW;
                    curtemplatH = templatH;
                }
            }
            //cout<<"Min:"<<currentMin<<endl;
            //最小值比设定阈值小。则推断识别出这个数字
            if (currentMin<threshold){
                numresult.push_back(index[currentIndex]);
                cout<<"第"<<countnumbers<<"个数字是:"<<index[currentIndex]<<endl;
                /*cout<<"左上角坐标为:("<<matchLoc.x<<","<<matchLoc.y<<")"<<endl;
                cout<<"右上角坐标:("<<matchLoc.x+templatW<<","<<matchLoc.y<<")"<<endl;
                cout<<"左下角坐标:("<<matchLoc.x<<","<<matchLoc.y+templatH<<")"<<endl;*/
                countnumbers++;
                rectangle(srcResult, matchLoc, cvPoint(matchLoc.x + curtemplatW, matchLoc.y+ curtemplatH), cvScalar(0,0,255));
                /*namedWindow("tmpresult");
                imshow("tmpresult",srcResult);
                waitKey(0);*/
                window_x =matchLoc.x+curtemplatW-1;
                return true;
            }
            //比阈值大则判定为非字符。扫描窗右移一个单位
            window_x++;
            return false;
    
        }

    窗体扫描,虚函数须要被实现

    virtual void processScan(){
            sourceW = source.cols;
            sourceH = source.rows;
            window_x = 0;
            window_y = 3;
            //加十以提高容错率
            bool last = false;
            while(window_x<sourceW-scanWindowW+5){
                if (window_x+scanWindowW>sourceW){
                    window_x = sourceW - scanWindowW;
                    last = true;
                }
                Mat tmp = scanWindow(window_x,window_y);
                match(tmp);
                if (last) break;
            }
            window_x = 30;
            scanWindowH = 35;
            window_y=sourceH - scanWindowH;
            while (window_x<=sourceW - scanWindowW-10){
    
                Mat tmp = scanWindow(window_x,window_y);
                match(tmp);
            }
    
        }

    针对不同图片建立了不同的类来实现:

    //识别有噪点的图像
    class noisyPic:public Picture{
    public:
        noisyPic(){
            Picture();
            threshold = 0.5;
            path="test\noisy.bmp";
            adaptiveBiSize = 17;
            adaptiveBiParam= 19;
            medianBlurSize = 5;
            scanWindowW = 38;
            scanWindowH = 38;
        }
        void displayResult(){
            cout<<"当前识别的是有噪点的图像。识别结果为:"<<endl;
            for (unsigned int i=0;i<numresult.size();i++){cout<<numresult[i]<<" ";}
            cout<<endl;
            cout<<"====================================================="<<endl;
            namedWindow("final");  
            imshow("final", srcResult);  
            waitKey(0); 
        }
    
    };
    
    //有划痕的图像
    class dirtyPic:public Picture{
    public:
        dirtyPic(){
            Picture();
            threshold = 0.48;
            path="test\dirty.bmp";
            adaptiveBiSize = 21;
            adaptiveBiParam= 23;
            medianBlurSize = 7;
            scanWindowW = 36;
            scanWindowH = 38;
        }
        virtual void displayResult(){
            cout<<"当前识别的是有划痕的图像,识别结果为:"<<endl;
            for (unsigned int i=0;i<numresult.size();i++){cout<<numresult[i]<<" ";}
            cout<<endl;
            cout<<"====================================================="<<endl;
            namedWindow("final");  
            imshow("final", srcResult);  
            waitKey(0); 
        }
    };

    主函数

    int main()  
    {  
        //正常图像,构造函数不指定參数时。默认识别第一张图
        //构造函数能够指定识别第几张图。以下以第三张为例
        Picture pic = Picture(3);
        pic.startRecognize();
    
        //识别有噪声图像
        noisyPic noisyPic;
        noisyPic.startRecognize();
    
        //识别有划痕图像
        dirtyPic dirtyPic;
        dirtyPic.startRecognize();
    
        //识别放大缩小图像
        scalePic scale = scalePic(1);
        scale.startRecognize();
    
        return 0;  
    }  

    为了方便童鞋们參考,提供了下载链接,只是要花一点积分的哦!(LZ下别的也是要积分的啊!

    戳我戳我

  • 相关阅读:
    weblogic的ssrf漏洞
    web服务器、Web中间件和Web容器的区别
    linux C判断文件是否存在
    Linux 文件锁flock 实现两个进程相互监听存活状态
    Linux 进程间通信之管道(pipe),(fifo)
    Linux 进程间通信系列之 信号
    android Binder机制(一)架构设计
    Linux 系统 文件锁 fcntl函数详解
    execlp启动android进程命令
    Linux环境编程--waitpid与fork与execlp
  • 原文地址:https://www.cnblogs.com/gcczhongduan/p/5371474.html
Copyright © 2011-2022 走看看