TesserOCR训练 - 走看看

zoukankan html css js c++ java

TesserOCR训练
1.CMD命令行进入图片目录。运行：
tesseract.exe testcode.tif testcode batch.nochop makebox
注意：上面的 testcode 名称必须保持一致。且在同一个文件夹下

程序自动在图片目录中生成 code1.box文件。

2.用jTessBoxEditor.jar 打开tif文件。

界面：

3.对程序分割结果进行校正。

（1）常用菜单解释：

　　

4.校正完成后，在cmd中， cd进入图片目录，执行命令：
tesseract.exe testcode.tif testcode nobatch box.train
再执行：
unicharset_extractor.exe testcode.box
5.在图片目录中创建一个txt文件，打开，输入：
testcode 1 0 0 1 0
然后将txt文件改名文：font_properties (不带后缀)

6.执行命令：
cntraining.exe testcode.tr
7.执行命令：
mftraining.exe -F font_properties -U unicharset testcode.tr
8.在图片目录中找到 unicharset inttemp normproto pfftable,在这几个文件前面加上训练名称前缀testcode.（如testcode.unicharset）

9.执行命令：
combine_tessdata testcode.
10.将testcode.traineddata 拷贝到 tesseract-OCR目录下的tessdata目录中
查看全文

相关阅读:
flume,kafka不在一个内网互相打通.md
尚硅谷Flink2020教程.md
常用命令.md
四象限工作效率-事件管理.md
甘特图目标实施-进度管控.md
PDCA循环法.md
SMART大目标拆解小目标.md
基于内外部竞争环境和竞争条件下的态势分析
 使用Java正则表达式批量提取文本信息
 使用markdown高效编写博客（创建标题）

原文地址：https://www.cnblogs.com/iack/p/3960432.html

Copyright © 2011-2022 走看看