zoukankan      html  css  js  c++  java
  • paip.验证码识别使用字符集的选取



    paip.验证码识别---使用字符集的选取
     ----作者Attilax , 1466519819@qq.com---  


    原则上,如果验证码是数字,应该只选用数字集..但是..如果面对选取ROI不干净的图片来说,可能有误差了.比如 1234后边如果有一个杂点没有去干净.可能就变成了12341


    虽然加强去噪会消除这个杂点..但去噪算法对其它图片的处理可能太过...

    此时一个比较好的办法,一个是选得出数字,然后根据数字数不符,进行二次去噪


    还有一种好的方法是扩大字符集..加个逗号,点号,星号..
    这样识别的时候会把杂点识别为点号一类的..到时候一个REPLACE就可以了..

    此外这种好处还就是对去噪后字符不连线的图片很有用..它可能把Q识别为()_,, T识别为`1`...只要进行误差还原就可以了..否则如果只用字母集去强行匹配,得到的结果

    要不就是其它字符,要不就是识别不了..






    当然更好的办法是两种方法同上厂,然后进行合并投票决定了..
  • 相关阅读:
    CF 142B Tprimes
    CF 231A Team
    poj 2001 Shortest Prefixes ——字典树入门
    hdu 1039 Easier Done Than Said?
    poj 2528 Mayor's posters
    hdu 1061 Rightmost Digit
    poj 2503 Babelfish
    CF271 A. Beautiful Year
    poj 2752
    CF271 B. Prime Matrix
  • 原文地址:https://www.cnblogs.com/attilax/p/15199733.html
Copyright © 2011-2022 走看看