zoukankan      html  css  js  c++  java
  • pytesseract+pillow

    1.首先准备环境:

    python版本:2.7/3.6

    操作系统:windows系统

    2.准备工具:

    tesseract-ocr(百度网盘地址:https://pan.baidu.com/s/1OL0g1MBzeijD23JN0UGC0Q)

    Pycharm(下载地址:http://www.jetbrains.com/pycharm/download/#section=windows)

    3.安装相关python包(作者使用的是py2.7)

    pip install Pillow

    pip install pytesseract

    4.使tesseract-ocr与python关联,从而使python能够调用Tesseract-OCR程序识别验证码/文字:

    C:python27Libsite-packagespytesseractpytesseract.py

    修改pytesseract.py文件中第24行将tesseract_cmd指向Tesseract-OCR的tesseract.exe

    原内容:

     

    修改后内容:

     

    注:新手一定要注意/与的区分

    5.打开Pycharm写程序:

     

    在此需要告诉新手的其中aaa.jpg是存放在py脚本的目录下,lang=‘chi_sim’代表中文识别,如果不加无法识别中文

    6.运行脚本可以看到结果

    特别提醒:如果步骤完全正确,但是运行报错,请卸载pytesseract重新安装问题就会解决(卸载命令pip uninstall pytesseract)

  • 相关阅读:
    Build a pile of Cubes
    一键升级所有pip过期库
    AWGN
    调制详解——待完善
    BASK、BFSK、BPSK调制方法的Matlab程序实现
    tomcat运行问题解决方法
    ehcache简单使用
    MySQL 数据库中用户表中口令登陆设置
    和自己赛跑的人
    中文词频统计
  • 原文地址:https://www.cnblogs.com/baoshilin/p/12401864.html
Copyright © 2011-2022 走看看