--2013年5月26日18:21:34
这个周末做了一件事情,把一份纸质稿变成了电子版--word文档,大家常常会遇到这样的情况
我把我的实现过程写下来分享
--原理
文字识别,OCR (Optical Character Recognition,光学字符识别)百科
--工具
看下百度知道里面的几个软件:百度知道 下面只说我试过的几个软件
1、汉王
2、office Document Image(貌似只有office2003,2007才有)
3、ABBYY FineReader OCR Professional 7.0.0.963
--过程
1、汉王,下载并安装了汉王,看上去就不爽,汉王的文字识别能力太差了,并且广告特别多,建议大家不用尝试汉王浪费时间了,如果是我没有发现汉王的好,觉得汉王好的要告诉我哦。
2、用office Document Image,尝试这个办法我没有找着网上的办法到最好,因为我的系统是win7,需要安装xp以及一下的环境,MS的这个功能用起来也烦,再说现在是2013年5月26日18:36:09,10年前的软件就还是别尝试了。
3、用了ABBYY FineReader OCR Professional 7.0.0.963
--ABBYY FineReader OCR
介绍:自行问度娘
ABBYY FineReader不仅可以是别文字,还可以识别格式
当然要重点说这个软件了,经过一番折腾,发现详见很晚,这个是收费的软件,免费试用15天好像是,在360上或者百度一下可以找到,找到最新的版本就可以了,200M以上吧,功能很强大,有中文版,用起来很舒服,如果要识别的图片很多,可以先把图片做成word->用office2010存成pdf,然后用ABBYY fineReader 快速识别。
--软件使用技巧
自个尝试吧,安装后是中文的,很容易上手
--总结
百度知道里面的软件我没有全部评测,用到ABBYY这里,发现很好用,所以分享出来,如果遇到这个需求,果断直接用ABBYY吧
思路有点乱,找一件东西,没有遇到合适的时候,各种凌乱,遇到了,相见很晚,不要恨。