在deepin中ocrmypdf指定语言进行ocr识别时,出现OCR engine does not have language data for the following requested languages
有2种可能,一种是你没安装语言数据包,另外一种是输错了
第一种情况
既然是没安装语言数据包,直接安装就好。
以安装简体中文语言数据包为例
打开终端,输入
sudo apt-get install tesseract-ocr-chi-sim
回车安装即可
第二种情况
还是以安装简体中文语言数据包为例
你可能输入的是以下的命令
ocrmypdf -l chi-sim test.pdf test-ocr.pdf
你安装的时候语言确实是 chi-sim ,不过这是针对 tesseract-ocr 而言的
ocrmypdf 语言数据包的参数的格式是 chi_sim
注意是下划线 _ ,并非横杠 -
正确的命令应该是
ocrmypdf -l chi_sim test.pdf test-ocr.pdf
其他带横杠的语言数据包以此类推