zoukankan      html  css  js  c++  java
  • py库: Tesseract-OCR(图像文字识别)

    http://blog.csdn.net/u012566751/article/details/54094692  Tesseract-OCR入门使用1

    http://blog.csdn.net/u012566751/article/details/54136836  Tesseract-OCR入门使用2

    http://blog.csdn.net/u012566751/article/details/54141109  Tesseract-OCR入门使用3

    https://github.com/tesseract-ocr/tesseract/wiki/APIExample  Tesseract API Example


    当前环境:win7,python3.6.0,pyCharm4.5。  python目录是:c:/python3/

    安装:

    一、安装 tesseract 库

    cd c:/python3/Scripts/

    pip  install  tesseract

    二、装程序:

    https://github.com/UB-Mannheim/tesseract/wiki

    这是非官方下载包,下载并安装4.0:  https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.0.0-alpha.20170804.exe

    安装时注意勾选简体中文,默认安装,安装完毕后,敲命令(看看装的怎么样了,支持什么语言):

    cd C:Program Files (x86)Tesseract-OCR

    tesseract

    tesseract -v

    tesseract --list-langs  #查看Tesseract-OCR支持语言

    三、改文件:

    C:Python3Libsite-packagespytesseractpytesseract.py,找到这两行:

    # CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
    tesseract_cmd = 'tesseract'

    改为这样:

    # CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
    #tesseract_cmd = 'tesseract'
    tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

    四、pyCharm里运行,就可以进行文字识别了:

     (先用画图,用微软雅黑字体,写几个数字、和诗词,保存成:ci.png)

    from PIL import Image
    import pytesseract
    text = pytesseract.image_to_string(Image.open('ci.png'), lang='chi_sim')
    print(text)

      

    ...

  • 相关阅读:
    vscode task 与 linux shell编程小记
    Python并行计算专题
    分类任务评价指标(Accuracy / Precision / Recall / F1 / ROC / AUC)
    JAVA笔记 10.04
    MySQL5.7忘记密码 Linux
    MYSQL 获取最近多少天时间列表
    Volatile 关键字的原理和实现
    安装正常APP时被小米提醒是诈骗APP不允许安装的问题
    【瞎口胡】网络流基础
    题解 Luogu P4774 [NOI2018]屠龙勇士
  • 原文地址:https://www.cnblogs.com/qq21270/p/7704952.html
Copyright © 2011-2022 走看看