最近使用 Tess4j 做一些 OCR图片文字识别的代码。
然后想当然的将这个 ITesseract ocr_robot = new Tesseract(); 作为了工具类做成了成员变量。
当多线程调用 doOCR 的时候就会报 Invalid memory access 的错。
然后从网上查了好几个都说是 setDatapath 的设置问题。
最后发现其实是 doOCR 源码里面有个init方法。
然后,init 会重新初始化一些参数。 所以 不能用多线程调用同一个Tesseract 对象的doOCR方法。
这样会导致内存混乱吧。需要把Tesseract代码改成多实例。或者使用对象池。