从2013年的记录看,JAVA中图片文字识别技术大部分采用ORC的tesseract的软件功能,后来渐渐开放了java-api调用接口。
图片文字识别技术,还是采用训练的方法。并未从根本上解决图片与文字的关联关系。
什么是tesseract:
tesseract是google的一个离线工具,用于图片的文字识别与提取。