电脑配置:window10, 64位操作系统,基于x64的处理器,Microsoft Visual Studio Community 2019 Version 16.4.5
问题 1:在用 tesseract.Net SDK 的把文本转换成pdf的使用过程中遇到了错误提示:Patagames.Ocr.Exceptions.OcrException: 'Unexpected error code: ',错误代码如下:
1 using (var api = OcrApi.Create())
2 {
3 api.Init(Languages.English);
4 using (var renderer = OcrPdfRenderer.Create(@"multipage_pdf_file", @". essdata"))
5 {
6 renderer.BeginDocument("Title");
7 api.ProcessPages(@"E:phototest.tif", null, 0, renderer);
8 renderer.EndDocument();
9 }
10 }
11 }
分析问题:
虽然错误提示是在 api.ProcessPages(@"E:phototest.tif", null, 0, renderer); 这一行,但是发现主要问题是 tessdata 的路径需要绝对路径,然后要想清楚找到生成的 pdf 位置,最好也用绝对路径
正确代码:
1 using (var api = OcrApi.Create())
2 {
3 api.Init(Languages.English);
4 using (var renderer = OcrPdfRenderer.Create(@"E:exportFilemultipage_pdf_file", @"E:visual_studio_projectTesseractNetSDK essdata"))
5 {
6 renderer.BeginDocument("Title");
7 api.ProcessPages(@"E:phototest.tif", null, 0, renderer);
8 renderer.EndDocument();
9 ;
10 }
11 }
最后:路径名称或者文件名称的错误都会导致出现这个错误,所以大家在输入路径名或者文件名的时候一定要认真核对清除,避免出错。
问题 2.