zoukankan      html  css  js  c++  java
  • python识别文字tesseract

    Ubuntu版本:
    
    1.tesseract-ocr安装 
    sudo apt-get install tesseract-ocr
    
    2.pytesseract安装 
    sudo pip install pytesseract
    
    3.Pillow 安装 
    sudo pip install pillow

    开始写代码:

    from PIL import Image
    from pytesseract import pytesseract
    
    
    image = Image.open('test.png')
    code = pytesseract.image_to_string(image,lang='chi_sim')
    print(code)

    报错了:

     找到路径,发现没有chi_sim.traineddata这个训练包

    # 安装训练数据(equ为数学公式包)
    sudo apt-get install tesseract-ocr-eng tesseract-ocr-chi-sim  tesseract-ocr-equ

    安装之后就会有训练包了,可以正常运行。

     英文识别正确率较高,中文就比较鸡肋了。

  • 相关阅读:
    STM32-串口通信
    STM32-系统计时器(systick)
    字符串操作常用的函数
    基本MarkDown语法
    结构
    python入门
    贪心算法小结
    POJ1631_高深DP
    POJ3046ANT_COUNTING
    POJ1742coins
  • 原文地址:https://www.cnblogs.com/codeDevotee/p/11376572.html
Copyright © 2011-2022 走看看