zoukankan      html  css  js  c++  java
  • pytesseract

    tesseract下载路径:https://digi.bib.uni-mannheim.de/tesseract/

    下载直接安装

    1、在使用pytesseract打开图片是遇到错误,没有找到文件

        pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH

     
     

    2、排查解决:

    在我们下载了PIL(命令pip install pillow)后,找到pytesseract.py文件,里面的tesseract_cmd ='tesseract',这里并没有指定文件路径

     
     

    3、直接在pycharm中安装tesseract-cor失败

     
     

    4、从网上找到相应的‘Tesseract-OCR’下载安装(寻找对应版本):

        地址:https://github.com/tesseract-ocr/tesseract/wiki

        Windows为例:

        点击Tesseract at UB Mannheim

     
     

        找到符合自己电脑的下载

     
     

    5、下载完后安装Tesseract-OCR

     
     
     
     

        选择自己安装的目录(要添加到环境变量里面去),一直下一步就完成了

     
     

    6、添加到环境变量的系统变量(PATH)去

     
     

    7、增加一个TESSDATA_PREFIX变量名,变量值还是我的安装路径C:Program FilesTesseract-OCR essdata这是将语言字库文件夹添加到变量中;

     
     

    8、打开终端,输入:tesseract -v,可以看到版本信息

     
     

    9、在pytesseract库下的pytesseract.py文件中找到tesseract_cmd = 'tesseract',修改成            tesseract_cmd =r'C:Program FilesTesseract-OCR esseract.exe'

        (刚才安装的路径下)

     
     

    10、再去运行程序

        可以简单识别验证码,没有报错了

     


    使用pytesseract识别验证码中遇到异常如下:

    pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path

    安装Pillow,命令pip install Pillow,安装完毕会在Python文件夹下Libsite-packagespytesseract这个文件夹,里面有pytesseract.py文件

    检查上述报错中的pytesseract.py源码,发现如下说明:

    # CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
    
    tesseract_cmd = 'tesseract'

    从网上找到相应的‘Tesseract-OCR’下载安装(寻找对应版本):https://github.com/tesseract-ocr/tesseract/wiki

    安装后的默认文件路径为(这里使用的是Windows版本):C:Program Files (x86)Tesseract-OCR

    然后将源码中的:

    tesseract_cmd = 'tesseract'

    更改为:

    tesseract_cmd = r'C:Program Files (x86)Tesseract-OCR	esseract.exe'
  • 相关阅读:
    HYSBZ 3813 奇数国
    HYSBZ 4419 发微博
    HYSBZ 1079 着色方案
    HYSBZ 3506 排序机械臂
    HYSBZ 3224 Tyvj 1728 普通平衡树
    Unity 3D,地形属性
    nginx 的naginx 种包含include关键字
    Redis 出现NOAUTH Authentication required解决方案
    mysql 8.0出现 Public Key Retrieval is not allowed
    修改jar包里的源码时候需要注意的问题
  • 原文地址:https://www.cnblogs.com/wenqiang-leo/p/13962265.html
Copyright © 2011-2022 走看看