zoukankan      html  css  js  c++  java
  • Ubuntu 上安装 OCR 扫描软件 gImageReader

    gImageReader 是一款开放源码的 OCR(光学字符识别)扫描工具软件,支持 Linux 和 Windows 系统,用户可用来扫描 JPEG,PNG,TIFF,GIFF 或 PDF 文件或者从扫描仪直接导入的文件,并识别字符。

    GitHub 地址:https://github.com/manisandro/gImageReader

    添加 PPA --> 更新软件源 --> 安装软件:

    sudo add-apt-repository ppa:sandromani/gimagereader
    sudo apt update
    sudo apt install gimagereader tesseract-ocr tesseract-ocr-eng tesseract-ocr-chi-sim tesseract-ocr-chi-tra  -y
    sudo apt install tesseract-ocr-chi-sim-vert tesseract-ocr-chi-tra-vert  -y
    

    卸载软件 --> 移除 PPA:

    sudo apt remove gimagereader -y
    sudo apt install ppa-purge -y
    sudo ppa-purge ppa:sandromani/gimagereader
    

    举例: 利用 gImageReader 识别下面两页图片中的字符。

    图一:

    图二:

    操作步骤

    1. 打开 gImageReader
    2. 添加上面两页图片
    3. 识别语言选择 多种语言(Multilingual)=chi_sim+eng
    4. 依次选择图一图二进行识别
    5. 复制或保存识别文本

    操作结果参照下图:


    See also


    寻找知识的源头,探索宇宙的奥秘。
    知识的存放地址:人的大脑里、书里、互联网上、自然界里。
    获取知识的最优路径:精品课程 > 精品书籍 > 官方文档 > 优质文章 > 与人交流(互为补充,构建知识体系)。
    内外兼修,形神合一。

  • 相关阅读:
    观察者模式
    工厂模式
    单例模式
    代理模式
    策略模式
    Ioc容器
    Spring概述
    02:入门
    01:背景
    编译原理感悟
  • 原文地址:https://www.cnblogs.com/keatonlao/p/12585750.html
Copyright © 2011-2022 走看看