zoukankan      html  css  js  c++  java
  • OCR 基本知识

    OCR,optical character recognition 的简称,也就是光学识别系统,属于图形识别的一个分支,OCR是针对印刷体字符,採用光学的方式将文档资料转换成原始资料黑白点阵的图像文件,通过识别软件将图像中的文字识别成中文和英文内码,然后转换成文本格式。这样计算机就能够通过OCR识别系统。能够清楚自己看到了什么,读到了什么,尤其是文字资料。

    (1)处理过程:
      影像输入->影像前处理->文字特征的提取->对照识别->最后通过人工矫正将误判的文字更正,最后将结果输出。

    (2)详细流程

       1、影像输入:目标文件经过光学仪器后生成位图存储在计算机。

       2、影像预处理:包含二值化、腐蚀与膨胀、中值滤波等。
        
           图像二值化:图像显示的时候仅仅能看到两种颜色(常常是黑白两色)。

         

       3、文字特征的提取:依据字符本身特点,在不同区域採集数据。

       4、对照数据库:通过画板制作对应的字母和数字模板作为对照的标准。

       5、对照识别:依据不用区域的特征比較,找出最相近的字符。

       6、输出结果:将最相近的字符作为识别的结果输出。即识别码输出。

  • 相关阅读:
    程序员的希波克拉底誓言[精华]
    怎样成为优秀的软件模型设计者
    C#中Delegate浅析与思考
    程序员是一个美好的职业[精华]
    hdu 1421(搬寝室)
    hdu 4022(map一对多)
    hdu 1114(完全背包)
    hdu 1159(最长公共子序列)
    hdu 2844(多重背包)
    hdu 1257(最长递增子序列)
  • 原文地址:https://www.cnblogs.com/mfmdaoyou/p/7365869.html
Copyright © 2011-2022 走看看