OCR模型训练 - 走看看

zoukankan html css js c++ java

OCR模型训练
ocr模型训练

pillow
```
是Python Image Library的3.0版本. 
用于在Python处理各种图片操作. 
```
ocr模型训练
- linux下软件:
  tesseract-ocr:
  sudo apt-get install tesseract-ocr
- java运行环境(deepin自带1.8)
- jTessBoxEditor软件:(该软件需要java环境)
  https://nchc.dl.sourceforge.net/project/vietocr/jTessBoxEditor/jTessBoxEditor-2.2.1.zip
使用次序:
- 训练模型需要大量图片.
- 使用jTessBoxEditor, 将所有需要训练的图片打包为tif格式的包.
- 然后使用 tesseract 将tif包,转变为box.
  tif文件名一般使用格式为.[语言].[字体].exp[数量]
  例如: english.arial.exp99
  tesseract 文件名.tif 文件名 -psm 7 batch.nochop makebox
  tesseract zwp.test.exp0.tif zwp.test.exp0 -l chi_sim -psm 7 batch.nochop makebox
- 转化为box之后, 就可以使用jTessBoxEditor进行训练了.
  在训练的过程当中, 如果是没有经过处理的验证码图片因为受噪点影响, 识别率特别低,应该先对图片进行降噪处理. 之后再进行训练.
查看全文

相关阅读:
JDBC数据库连接
 JDBC驱动程序类型
 JDBC简单示例代码
 JDBC SQL语法
 JDBC是什么？
JDBC快速入门教程
 JUnit4参数化测试实例
 JUnit套件测试实例
 JUnit4时间（超时）测试实例
 JUnit4忽略（Ignore）测试实例

原文地址：https://www.cnblogs.com/jrri/p/12694106.html

Copyright © 2011-2022 走看看