zoukankan      html  css  js  c++  java
  • python 文字识别 之 pytesseract

    pytesseract资源

    链接:https://pan.baidu.com/s/1eTsqhsY 密码:j0yo

     安装时前面一直next就可以了,直到这一步,勾选Math和Chinese,支持计算和中文

    要记住安装的目录

    我的是 F:Program Files (x86)Tesseract-OCR

     然后,

    在系统变量中添加一个TESSDATA_PREFIX,变量值还是文件路径
    我的是F:Program Files (x86)Tesseract-OCR

    打开Python安装路径:Python36Libsite-packagespytesseractpytesseract.py,把路径改为自己的安装路径

     运行下面代码

    from PIL import Image
    import pytesseract
    
    img = Image.open('aaa.png')
    text = pytesseract.image_to_string(img,lang='chi_sim')
    print (text)
    

      

     图片:1.png

    运行结果

    结果会有一点出入,需要对现有模型进行训练才能提高匹配度

    chi_sim.traineddata是中文对应的模型,后面会学习对模型的训练,提供匹配度

    关于安装pytesseract的一些链接:

    http://blog.csdn.net/cjvs9k/article/details/79044548

    http://blog.csdn.net/qiushi_1990/article/details/78041375

    http://blog.csdn.net/ztzy520/article/details/53946327

    https://www.cnblogs.com/chenbjin/p/4147564.html

  • 相关阅读:
    第五小节之JAVA IO流
    第四小节之Java 集合类
    初学的重点
    第三小节之Java API
    实践周java基础软件开发app之五子棋
    出栈合法性
    Python介绍
    Ubuntu主题美化篇
    Ubuntu16.04比较好的一系列软件安装介绍
    Ubuntu使用Shadow socks-qt5
  • 原文地址:https://www.cnblogs.com/cxscode/p/8316815.html
Copyright © 2011-2022 走看看