1、下载teseract
下载地址github: https://github.com/tesseract-ocr/tesseract/releases/
2、编译源码
源码的编译有两种方式
无论哪种方式,都需要cmake来把源码生成vs工程文件.sln。
cmake的下载地址:https://cmake.org/download/
cmake有两种使用方式,一个是命令行 一个是GUI ,写过一个简单的文档,传送门:https://www.cnblogs.com/132818Creator/p/11797406.html
文档实在太简单,不会就百度吧,很简单。
1)使用cppan解决交叉编译的问题
cppan的下载地址:https://cppan.org/client/
具体的安装包,看你的系统环境,选择相应的安装包
管理员身份打开cmd,进入Tesseract文件夹,在文件夹下可以发现有个cppan.yml文件,(我是全搞清楚才写的,我当时不记得是哪次下载的,就没有这个文件,所以一定要到的下载包含这个的。)
然后直接敲入命令:cppan (如果出现 “no spec file”,就是目录不对,没有找到cppan.yml)
然后会弹出各种下载啊什么的,一大堆,这些都不用管。但是要留意下有没有报错啥的,就是download这些是下载,delete啥的删除文件这都是正常的,我是后面的写的总结所以没有截图。
反正报error能看的见,我当时就是下载;leptonica这个库,就是一直下载失败,我也不知道为啥,后面第二天重新执行命令就可以了,可能是当时网络不太好。这是坑啊。
然后执行cmake .. 命令,注意两个点,或者是 使用cmake的gui,cmake看上方文档传送。
2)自己解决交叉编译的问题,一层一层的去下载生成,这个很麻烦,虽然我也尝试了下
先下载tiff;
下载地址:http://download.osgeo.org/libtiff/tiff-4.0.9.zip
用cmake生成vs的工程文件,然后编译成库,tiff.lib和tiff.dll
然后下载leptonic:
下载地址:http://www.leptonica.com/source/leptonica-1.76.0.tar.gz
然后继续cmake,
这次cmake要加入依赖的库,
然后再编译tesseract,这步我没测试,太麻烦了,有点懒。。。。 这种方法真的不是很建议。