zoukankan      html  css  js  c++  java
  • pytesseract

    tesseract下载路径:https://digi.bib.uni-mannheim.de/tesseract/

    下载直接安装

    1、在使用pytesseract打开图片是遇到错误,没有找到文件

        pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH

     
     

    2、排查解决:

    在我们下载了PIL(命令pip install pillow)后,找到pytesseract.py文件,里面的tesseract_cmd ='tesseract',这里并没有指定文件路径

     
     

    3、直接在pycharm中安装tesseract-cor失败

     
     

    4、从网上找到相应的‘Tesseract-OCR’下载安装(寻找对应版本):

        地址:https://github.com/tesseract-ocr/tesseract/wiki

        Windows为例:

        点击Tesseract at UB Mannheim

     
     

        找到符合自己电脑的下载

     
     

    5、下载完后安装Tesseract-OCR

     
     
     
     

        选择自己安装的目录(要添加到环境变量里面去),一直下一步就完成了

     
     

    6、添加到环境变量的系统变量(PATH)去

     
     

    7、增加一个TESSDATA_PREFIX变量名,变量值还是我的安装路径C:Program FilesTesseract-OCR essdata这是将语言字库文件夹添加到变量中;

     
     

    8、打开终端,输入:tesseract -v,可以看到版本信息

     
     

    9、在pytesseract库下的pytesseract.py文件中找到tesseract_cmd = 'tesseract',修改成            tesseract_cmd =r'C:Program FilesTesseract-OCR esseract.exe'

        (刚才安装的路径下)

     
     

    10、再去运行程序

        可以简单识别验证码,没有报错了

     


    使用pytesseract识别验证码中遇到异常如下:

    pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path

    安装Pillow,命令pip install Pillow,安装完毕会在Python文件夹下Libsite-packagespytesseract这个文件夹,里面有pytesseract.py文件

    检查上述报错中的pytesseract.py源码,发现如下说明:

    # CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
    
    tesseract_cmd = 'tesseract'

    从网上找到相应的‘Tesseract-OCR’下载安装(寻找对应版本):https://github.com/tesseract-ocr/tesseract/wiki

    安装后的默认文件路径为(这里使用的是Windows版本):C:Program Files (x86)Tesseract-OCR

    然后将源码中的:

    tesseract_cmd = 'tesseract'

    更改为:

    tesseract_cmd = r'C:Program Files (x86)Tesseract-OCR	esseract.exe'
  • 相关阅读:
    国内鲜为人知的“操作系统” Friend OS {Ep.1}
    好久没有发布什么内容了,今天推荐一个网站:Viritual x86
    温馨提示:yueming124.xyz的邮箱已经被我停用。
    Python
    Python -面试题
    码云-拉取远程代码
    mysql
    git 合并代码
    python 字典添加键值对 键相同值被覆盖的问题
    python 字典的减法
  • 原文地址:https://www.cnblogs.com/wenqiang-leo/p/13962265.html
Copyright © 2011-2022 走看看