zoukankan      html  css  js  c++  java
  • Tesseract-OCR 训练教程(一)

    实际应用中[font]替换为你自己的字体名,比如newfont、hehe等

    1.根据tif生成box文件(位置宽高等信息)
    tesseract [font].font.exp0.tif [font].font.exp0 batch.nochop makebox
    2.jTessBoxEditor 调整字体参数
    3.定义字符配置文件
    echo [font] 0 0 0 0 0>font_properties
    font 0 0 0 0 0

    4.从所有文件中提取字符,生成字符集文件
    unicharset_extractor.exe [font].font.exp0.box

    5.生成训练文件(.tr)
    tesseract mjorcen.normal.exp0.jpg mjorcen.normal.exp0 nobatch box.train
    6.生成字体特征文件
    mftraining -F font_properties -U unicharset -O [font].unicharset [font].font.exp0.tr

    7.聚合tr文件
    cntraining.exe [font].font.exp0.tr

    8.重命名文件
    rename normproto [font].normproto
    rename inttemp [font].inttemp
    rename pffmtable [font].pffmtable
    rename shapetable [font].shapetable

    9.合并所有文件,生成一个大的资库文件
    combine_tessdata.exe [font].

  • 相关阅读:
    学习进度10
    阅读笔记07
    构建之法阅读笔记06
    学习进度09
    构建之法阅读笔记05
    团队项目个人每日总结(4.27)
    学习进度08
    构建之法阅读笔记04
    写好一份技术简历很重要
    技术人员的发展之路
  • 原文地址:https://www.cnblogs.com/password1/p/9213796.html
Copyright © 2011-2022 走看看