zoukankan      html  css  js  c++  java
  • 【转】Python验证码识别处理实例

    原文出处: 林炳文(@林炳文Evankaka)   

    一、准备工作与代码实例

    1、PIL、pytesser、tesseract

    (1)安装PIL:下载地址:http://www.pythonware.com/products/pil/(CSDN下载

    下载后是一个exe,直接双击安装,它会自动安装到C:Python27Libsite-packages中去,

    (2)pytesser:下载地址:http://code.google.com/p/pytesser/,(CSDN下载

    下载解压后直接放C:Python27Libsite-packages(根据你安装的Python路径而不同),同时,新建一个pytheeer.pth,内容就写pytesser,注意这里的内容一定要和pytesser这个文件夹同名,意思就是pytesser文件夹,pytesser.pth,及内容都要一样!

    (3)Tesseract OCR engine下载:http://code.google.com/p/tesseract-ocr/(CSDN下载

    下载后解压,tessdata文件夹,用其替换掉pytesser解压后的tessdata文件夹即可。(就上面的pytesser文件夹)

    二、验证

    (1)原理:

    验证码图像处理

    验证码图像识别技术主要是操作图片内的像素点,通过对图片的像素点进行一系列的操作,最后输出验证码图像内的每个字符的文本矩阵。

    1、读取图片
    2、图片降噪
    3、图片切割
    4、图像文本输出

    (2)验证字符识别

    验证码内的字符识别主要以机器学习的分类算法来完成,目前我所利用的字符识别的算法为KNN(K邻近算法)和SVM (支持向量机算法),后面我 会对这两个算法的适用场景进行详细描述。

    1、获取字符矩阵
    2、矩阵进入分类算法
    3、输出结果

    要验证的图片如下:

    (3)、简单的命令:

    或者直接:

    (4)、复杂一点的

    上面的只能对一些比较简单的做处理,一

    原理:彩色转灰度,灰度转二值,二值图像识别

    运行后效果:

    validatepython

  • 相关阅读:
    pandas高效实现条件逻辑
    Python教程:文件、异常处理和其他
    最终初学者指南,以数据科学用例赢得分类黑客马拉松
    用Nvidia Jetson Nano 2GB和Python构建一个价值60美元的人脸识别系统
    一幅图像能顶16x16字!——用于大规模图像缩放识别的变压器(对ICLR 2021年论文的简要回顾)
    接缝雕刻算法:一种看似不可能的图像大小调整方法
    apache与nginx的优缺点的比较
    php5与php7的区别
    git基本的命令大全
    redis和membercache的区别
  • 原文地址:https://www.cnblogs.com/chenyang920/p/8076360.html
Copyright © 2011-2022 走看看