python中文ocr方案-pytesseract

pytesseract是google维护的具有学习功能的OCR引擎，3.0以后支持中文识别。

安装：

1. 安装tesseract-ocr组件；记得同步下载简体中文与英文语言包。

2. 安装PIL，需注意Windows64位版本

3. pip install pytesseract

使用:

image = Image.open("1.jpg")  # 打开图片
image.load()  # 加载一下图片，防止报错，此处可省略
image.show()  # 调用show来展示图片，调试用，可省略
tessdata_dir_config = '--tessdata-dir "C:\Program Files (x86)\Tesseract-OCR\tessdata"'
vcode = pytesseract.image_to_string(image, lang='chi_sim', config=tessdata_dir_config)
print vcode

查看全文

相关阅读:
python_linux系统相关配置
 python_字典dict相关操作
 python_传参
 mapreduce 学习笔记
 linux 常用命令
 C++ stringstream介绍，使用方法与例子
 C++/C++11中std::numeric_limits的使用
 C++中string erase函数的使用
 C++中accumulate的用法
 malloc的用法和意义

原文地址：https://www.cnblogs.com/Teddy/p/7238718.html