zoukankan      html  css  js  c++  java
  • 【转】Python验证码识别处理实例

    原文出处: 林炳文(@林炳文Evankaka)   

    一、准备工作与代码实例

    1、PIL、pytesser、tesseract

    (1)安装PIL:下载地址:http://www.pythonware.com/products/pil/(CSDN下载

    下载后是一个exe,直接双击安装,它会自动安装到C:Python27Libsite-packages中去,

    (2)pytesser:下载地址:http://code.google.com/p/pytesser/,(CSDN下载

    下载解压后直接放C:Python27Libsite-packages(根据你安装的Python路径而不同),同时,新建一个pytheeer.pth,内容就写pytesser,注意这里的内容一定要和pytesser这个文件夹同名,意思就是pytesser文件夹,pytesser.pth,及内容都要一样!

    (3)Tesseract OCR engine下载:http://code.google.com/p/tesseract-ocr/(CSDN下载

    下载后解压,tessdata文件夹,用其替换掉pytesser解压后的tessdata文件夹即可。(就上面的pytesser文件夹)

    二、验证

    (1)原理:

    验证码图像处理

    验证码图像识别技术主要是操作图片内的像素点,通过对图片的像素点进行一系列的操作,最后输出验证码图像内的每个字符的文本矩阵。

    1、读取图片
    2、图片降噪
    3、图片切割
    4、图像文本输出

    (2)验证字符识别

    验证码内的字符识别主要以机器学习的分类算法来完成,目前我所利用的字符识别的算法为KNN(K邻近算法)和SVM (支持向量机算法),后面我 会对这两个算法的适用场景进行详细描述。

    1、获取字符矩阵
    2、矩阵进入分类算法
    3、输出结果

    要验证的图片如下:

    (3)、简单的命令:

    或者直接:

    (4)、复杂一点的

    上面的只能对一些比较简单的做处理,一

    原理:彩色转灰度,灰度转二值,二值图像识别

    运行后效果:

    validatepython

  • 相关阅读:
    windows update error 0x8024401c
    linux杀毒软件ClamAV的安装使用
    firewalld防火墙设置
    RPM-GPG-KEY详解
    centos修改默认启动级别
    debian9.6修改系统语言
    ubuntu18.04修改网卡名称为eth0
    Windows server 1709(不含UI)模板部署
    NVIDIA-SMI系列命令总结
    bash: lspci: command not found解决方法
  • 原文地址:https://www.cnblogs.com/chenyang920/p/8076360.html
Copyright © 2011-2022 走看看