pytesseract - 走看看

zoukankan html css js c++ java

pytesseract
import pytesseract import cv2 img = cv2.imread("captcha.jpg",0) try: img.shape except AttributeError: pass else: code = pytesseract.image_to_string(img) print(code)
centos 安装tesseract
yum-config-manager --add-repo https://download.opensuse.org/repositories/home:/Alexander_Pozdnyakov/CentOS_7/ sudo rpm --import https://build.opensuse.org/projects/home:Alexander_Pozdnyakov/public_key yum update yum install tesseract yum install tesseract-langpack-deu
　　

接口就是pytesseract.image_to_string(),前提就是需要安装tesseract-OCR，并加入环境变量。

这里再记录一下识别中文的流程：

1. 下载二进制windows安装包

https://github.com/tesseract-ocr/tesseract/wiki/4.0-with-LSTM#400-alpha-for-windows

一键傻瓜式安装。安装完成后不要忘记把tesseract.exe所在路径加入环境变量。

2.安装简体中文包

https://github.com/tesseract-ocr/tessdata

下载chi_sim.traineddata并将其放入C:Program Files (x86)Tesseract-OCR essdata路径下。

最后，可以识别了，但是识别率惨的一批。。。。还需要我们训练自己的字体库。
查看全文

相关阅读:
CDH5.16.1集群企业真正离线部署
 创建node节点上kubeconfig文件
 二进制文件安装安装flannel
二进制文件安装安装etcd
二进制文件安装k8s所需要的证书服务
 快速安装k8s，版本为1.13.8
利用dockerfile 安装一个nginx-1.14.1
在非spring管理的类中,使用spring管理的类
 远程连接MySQL错误:Can't connect to MySQL server (10060)
Java继承与多态

原文地址：https://www.cnblogs.com/zenan/p/9242016.html

Copyright © 2011-2022 走看看