zoukankan      html  css  js  c++  java
  • python安装tesseract

    一、最近在学习python爬虫的时候需要用到tesseract,但书上的给的教程对我并不适用,坑了好久天,才终于成功。

    二、方法:

      1、由于我看的是静谧博主的那本书。他给的教程在python3安装有问题。

      2、步骤:

        (1)首先安装tesseract按照默认安装,可以不用下载所有的语言。

        (2)pip install pytesseract pillow.(静谧博主教程可能用的python2,对于Python3包名改了)

        下面是最大的坑。。。

        (1)显示tesseract.exe不存在,我在网上看说要将tesseract.exe的文件路径添加到环境变量中。最好将用户和系统环境变量都加上,然后打开site-pakges下的pytesseract文件下的tesseract.py文件下,将

    tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'
    改为上面格式。如果是没有按照默认安装,需要改为你自己的安装路径。
        (2)pytesseract.pytesseract.TesseractError: (1,’Error opening data file /usr/local/share/tessdata/eng.traineddata’)  出现这个错误。
          报错会提示将TESSDATA_PREFIX=
    C:/Program Files (x86)/Tesseract-OCR添加到环境变量中,最好是将变量在用户和系统都添加,不知道为什么添加一个还是会报错。
      3、测试:
        
    1 import pytesseract
    2 from PIL import Image
    3 image = Image.open('F://python/image.png')
    4 code = pytesseract.image_to_string(image)
    5 print (code)
     完工!!!(希望能帮到你)
    
    
  • 相关阅读:
    尝试消除switch
    JsUnit的测试套件
    GetCallbackEventReference对我来说太复杂了
    实现获取客户端的MAC地址(2)
    控件开发复习
    在VS2008的JScript编辑器中显示为命名空间
    函数参数修饰符out、ref及空白的区别
    检测代码位置的比较(C#代码VS存贮过程)
    发布时,正在使用的用户出错
    js特效,加速度,图标跳动
  • 原文地址:https://www.cnblogs.com/monty12/p/9952880.html
Copyright © 2011-2022 走看看