zoukankan      html  css  js  c++  java
  • python pytesseract使用

    正确使用方法

    1.tesseract-orc安装
    tesseract-ocr-setup-3.05.00dev.exe下载
    2.pytesseract

    pip install pytesseract
    3.设置 tesseract-orc路径

    • C:Program Files (x86)Tesseract-OCR添加到系统路径(路径因安装过程而异)
    • 修改pytesseract.py文件
      tesseract_cmd = "C:/Program Files (x86)/Tesseract-OCR/tesseract.exe"
    • 设置环境变量 TESSDATA_PREFIX
      C:Program Files (x86)Tesseract-OCR essdata
    #coding = utf -8
    from PIL import Image
    import pytesseract
     
    im = Image.open("2.png")
    text = pytesseract.image_to_string((im), lang='chi_sim')
    print (text)
    
    try:
        import Image
    except ImportError:
        from PIL import Image
    import pytesseract
    #如果PATH中没有tesseract可执行文件,请包含以下内容:
    pytesseract.pytesseract.tesseract_cmd = r'<full_path_to_your_tesseract_executable>'
    #示例tesseract_cmd = r'C: Program Files(x86) Tesseract-OCR  tesseract'
    #简单的图像串
    print(pytesseract.image_to_string(Image.open('test.png')))
    #法语文本图像串
    print(pytesseract.image_to_string(Image.open('test-european.jpg'), lang='fra'))
    #获取包围盒估计
    print(pytesseract.image_to_boxes(Image.open('test.png')))
    #获取详细的数据,包括盒,置信线和页码
    print(pytesseract.image_to_data(Image.open('test.png')))
    #获取有关方向和脚本检测信息
    print(pytesseract.image_to_osd(Image.open('test.png'))
    #为了绕过内部图像的转换,只需用相对或绝对图像路径
    #注:如果你不使用支持的图像,正方体将返回错误
    print(pytesseract.image_to_string('test.png'))
    

    参考
    参考

  • 相关阅读:
    Unity3d设置QualitySettings为Beautiful Xcode发布错误
    滚轮拉近相机
    (转)oracle
    (转)Oracle存储过程基本语法
    (转)Oracle执行字符串
    (转)Oracle 临时表用法
    安装包范例
    (转)使用PowerDesigner生成HTML功能
    (转)winform下TCP通信的简单应用
    (转)winform下UPD通信的简单应用
  • 原文地址:https://www.cnblogs.com/tomyyyyy/p/11135191.html
Copyright © 2011-2022 走看看