zoukankan html css js c++ java

python pytesseract使用

正确使用方法

1.tesseract-orc安装
tesseract-ocr-setup-3.05.00dev.exe下载
2.pytesseract

pip install pytesseract
3.设置 tesseract-orc路径

将 C:Program Files (x86)Tesseract-OCR添加到系统路径（路径因安装过程而异）
修改pytesseract.py文件
tesseract_cmd = "C:/Program Files (x86)/Tesseract-OCR/tesseract.exe"
设置环境变量 TESSDATA_PREFIX
C:Program Files (x86)Tesseract-OCR essdata

#coding = utf -8
from PIL import Image
import pytesseract
 
im = Image.open("2.png")
text = pytesseract.image_to_string((im), lang='chi_sim')
print (text）

try:
    import Image
except ImportError:
    from PIL import Image
import pytesseract
＃如果PATH中没有tesseract可执行文件，请包含以下内容：
pytesseract.pytesseract.tesseract_cmd = r'<full_path_to_your_tesseract_executable>'
＃示例tesseract_cmd = r'C： Program Files（x86） Tesseract-OCR  tesseract'
＃简单的图像串
print(pytesseract.image_to_string(Image.open('test.png')))
＃法语文本图像串
print(pytesseract.image_to_string(Image.open('test-european.jpg'), lang='fra'))
＃获取包围盒估计
print(pytesseract.image_to_boxes(Image.open('test.png')))
＃获取详细的数据，包括盒，置信线和页码
print(pytesseract.image_to_data(Image.open('test.png')))
＃获取有关方向和脚本检测信息
print(pytesseract.image_to_osd(Image.open('test.png'))
＃为了绕过内部图像的转换，只需用相对或绝对图像路径
＃注：如果你不使用支持的图像，正方体将返回错误
print(pytesseract.image_to_string('test.png'))

参考
 参考

查看全文

相关阅读:
关于响应式框架的定位不了元素的坑
 pychrom 中文版
 firebug定位工具很强大
 查询数据中所有表名
 java解析Json中获取Array字段值及嵌套Json对象
 mysql表操作
 集合框架（二）
集合框架
 Java API（二）
JDBC入门

原文地址：https://www.cnblogs.com/tomyyyyy/p/11135191.html

最新文章
几个人
 jdbc连接，操作
 左外连接，右外连接
 全选，反选
 省市县联动
 配置文件dispatcher在web.xml里的配置
 spring的ioc技术
 spring3层
 MVP
String2LongUtil