zoukankan      html  css  js  c++  java
  • 【Linux】- centos部署tesseract

    安装相关依赖

    sudo yum install autoconf automake  

    sudo yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel

    安装leptonica-1.72

    wget http://www.leptonica.com/source/leptonica-1.72.tar.gz

    tar -xvf leptonica-1.72.tar.gz

    cd leptonica-1.72

    执行配置指令 ./configure 

    执行编译指令 make

    执行安装指令 sudo make install 

    至此,leptonica安装完毕

    安装tesseract

    wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz

    如不能正常下载,可以网盘下载

    https://pan.baidu.com/s/1mj6YTIw  

    提取码是:95p5

    解压指令 tar xzvf 3.04.00.tar.gz

    cd tesseract-3.04.00

    分别执行以下指令:

    sudo ./autogen.sh

    执行配置指令 ./configure

    执行编译指令 make

    执行安装指令 sudo make install 

    执行指令 sudo ldconfig

    这一步安装可能存在的问题较多,记录如下:

    错误1:

    缺少包,

    执行指令:sudo yum install gcc-c++ 

    然后在重新执行 ./configure

    错误2:

    make: Nothing to be done for `all' 

    解决:

    make clean 清除安装时留下的文件

    在运行一下sudo ldconfig

    在重新执行安装tesseract 步骤

    错误3:

    make[2]: Nothing to be done for `install-exec-am'.
    make[2]: Nothing to be done for `install-data-am'.

    解决:

    make clean 清除安装时留下的文件

    在运行一下sudo ldconfig

    重新执行安装tesseract 步骤,其中./configure  改为./configure --prefix=/usr

    错误4:

    make[1]: *** [install-bfd] Error 2
    make[1]: Leaving directory `/usr/local/gdb-7.10'

    解决:

    ./configure --prefix=/usr/local/gdb #不要和gdb-version源码相同目录即可。

    错误5:

    ldconfig: Can't create temporary cache file /etc/ld.so.cache~: Permission denied

    解决:

    export LD_LIBRARY_PATH=/usr/local/lib

    下载字体

    下载安装英文,中文繁体,中文简体 识别库
    wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata
    wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata 
    wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata
    如不能下载,请参考上面网盘地址进行下载

    将刚刚的文件拷贝到tessdata文件夹下:

    sudo cp chi_sim.traineddata /usr/local/share/tessdata
    sudo cp eng.traineddata /usr/local/share/tessdata
    sudo cp eng.traineddata.part /usr/local/share/tessdata

    测试

    查看版本  tesseract --version

    cd tesseract-3.04.00

    cd testing

    执行  tesseract phototest.tif result -l eng

     

    再查看testing目录下的文件,发现多了一个result.txt:

    打开 cat result.txt

    参考:

    1、https://blog.csdn.net/wanght89/article/details/78329546

    2、https://blog.csdn.net/nsnv_hunter/article/details/79414752

    3、https://blog.csdn.net/pangyunsheng/article/details/79372845

  • 相关阅读:
    潜水员
    混合背包
    多重背包问题
    归并排序——最省时的排序
    HDU 1556 Color the ball
    2016 ACM/ICPC Asia Regional Dalian Online Football Games
    poj 2352 Stars
    poj 2299 Ultra-QuickSort
    关于原码反码补码以及位元算
    2016 湖南省省赛 Problem A: 2016
  • 原文地址:https://www.cnblogs.com/zheng1076/p/10869293.html
Copyright © 2011-2022 走看看