1. 安装配置
1、pip install pytesseract
2、pip install pillow
3、安装tesseract-ocr:http://jaist.dl.sourceforge.net/project/tesseract-ocr-alt/tesseract-ocr-setup-3.02.02.exe
4、找到 pytesseract.py 更改 tesseract_cmd = r'C:Program Files (x86)Tesseract-OCR esseract.exe'
5、添加环境变量(变量名:TESSDATA_PREFIX,变量值:C:Program Files (x86)Tesseract-OCR,即安装目录)
6、如果识别中文,下载 chi_sim.traineddata,并拷贝到 C:Program Files (x86)Tesseract-OCR essdata目录下
2.识别中文
2.1图片
2.2 运行程序
#!/usr/bin/env python # -*- codinfg:utf-8 -*- ''' @author: Jeff LEE @file: 图片识别.py @time: 2018-07-20 10:59 @desc: ''' from PIL import Image import pytesseract Image = Image.open('e.jpg') # 打开图片 text = pytesseract.image_to_string(Image,lang='chi_sim') #使用简体中文解析图片 print(text)