python实战===用python识别图片中的中文 - 走看看

zoukankan html css js c++ java

python实战===用python识别图片中的中文
需要安装的模块

PIL

pytesseract

需要下载的工具：

http://download.csdn.net/download/bo_mask/10196285

因为之前百度云的链接总失效，所以上传到了csdn，如果csdn没有积分的朋友可以到qq群中下载

下载解压后，安装到默认的路径下，安装完成后如下图1：

并且复制解压文件的chi_sim.traineddata 文件到安装路径 C:Program Files (x86)Tesseract-OCR essdata 下图2，图3：

好的，如果你上面所有安装完了，那么还有最后一步，更改配置文件，位置如下图4：

打开后将原来的注释掉，新增：

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
# tesseract_cmd = 'tesseract'

tesseract_cmd = u'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe' #此路径是你安装后的路径，对应的是图1的路径

保存！环境配置结束~

如下图，保存为111.png：
#test.py

from PIL import Image import pytesseract text=pytesseract.image_to_string(Image.open('111.png'),lang='chi_sim') print(text)
执行结果：

(─.─||| 。。。。。。。

顺便提一下

如果有任何问题,你可以在这里找到我，软件测试交流qq群，209092584
查看全文

相关阅读:
Ubuntu中pip的疑难杂症
 Python 分类方法记录
 Python 绘制热图
 脚本学习
 Ubuntu 基础使用教程
 机器学习各种相似性度量及Python实现
 Ubuntu 16.04安装R及Rstudio
机器学习和数据挖掘领域大牛
 vux+vue-cli3.0坑
 函数的抖动以及节流

原文地址：https://www.cnblogs.com/botoo/p/8251606.html

Copyright © 2011-2022 走看看