zoukankan      html  css  js  c++  java
  • 百度OCR识别示例

    文章地址:https://www.cnblogs.com/Charltsing/p/OcrAnswerer.html

    最新版为v4.1版,开放一定概率的八窗口体验功能,请截图体验(多点几次图片)。更新日期:2018.8.6  22:00

    工具特色:
    1、鼠标划框、三种截图方式、急速截图
    2、八窗口搜索、高亮匹配答案、二级链接精准搜索
    3、两种OCR引擎、Nlp分词,高亮匹配更完善
    4、双题库分别支持精确和模糊两种检索,答案更迅速
     

    ************************************************

    最快上手指南:
    1、申请百度文字识别和自然语言token
    2、电脑上安装雷电模拟器,并启动。注意模拟器窗口不要超过屏幕边界,也不要完全被答题工具界面挡上,要能看到题目。
    3、打开本工具,点开配置界面,设置电脑窗口截图,选择雷电模拟器。
    4、主界面选择你要答题的app,点击图片答题。如果没有你要的App,点一下设置题干或选项区域按钮设置Ocr区域,鼠标划框设置,再点一下同一按钮确认区域数字,然后写上app名,点保存区域。
    5、新手推荐百度搜索引擎+Web指定网站搭配的设置,并选中搜索二级网站答案选项,其它配置看压缩包中的详细说明。
    6、需要题库和完整八窗口功能的,请QQ联系作者。

    一直以来,都有人问我这个工具和其他工具有什么不同之处,能不能实现其它工具的功能(例如答题go、xx智能答题助手之类的)。
    这里我说一下:

    1、本工具最大的特色是兼具题干、选项的高亮匹配和Web搜索双重答题功能,分词修正之后的高亮匹配更准确。
    2、本工具支持鼠标划框选择OCR区域、支持三种截图方式、两种OCR引擎,两种题库检索适应性广,二级网站检索答案更精确,准确率最高。
    3、定制Web搜索,针对不同的app可以打开或关闭Web功能,如果启用Web请在设置里面选用不同的Web答题模式,对不同的App有奇效。
    3、本工具不适合无脑答题的用户群体(无脑答题的准确率大约在60%~70%之间,视app不同这个数字可能会浮动,本工具的目标是搜索匹配准确率在85%以上)。
    4、希望无脑答题的,请建立题库。本工具支持双题库,一个精确搜索,一个相似度匹配,答题更方便。适应一些百度找不到题目的学校、公司、事业单位内部答题。
    5、本工具与其他工具之间不构成竞争关系,互相取长补短而已。

         本工具完整八窗口和题库功能只开放给捐助费用超过38元的支持者。建议捐助金额在38~58之间。不捐助者也能答题,但只能随机看到八窗口高亮结果或一两个窗口的数据。捐助作者,请点击“支持作者”按钮扫二维码,然后QQ联系我要密码,密码永久有效。需要定制功能的费用另谈。

    4.095版升级说明
    1、搜狗反爬虫有时候会检测比较严格。如果左边四个窗口不显示内容,请打开web模式搜两三次看一下是否正常。或者用浏览器访问一下搜狗,看看是否需要输入人机识别验证码。
    2、如果没什么特殊需求,还是用百度搜索吧。

    4.1版升级说明
    无变化。

    4.093版升级说明
    1、增加web模式下显示第四选项高亮搜索选项
    2、Txt题库强制显示概率最高的答案

    4.092版升级说明
    1、修复百度搜索不显示搜索结果数量的bug
    2、修改nlp错误提示
    3、二级网站答案字数限制在120个字符。

    4.09版升级说明
    1、修改选项全词匹配的高亮配色。
    2、修复若干bugs

    4.08版升级说明
    1、加入选项分色高亮设置,此功能不支持选项分词高亮。
    2、加入题干背景可选设置
    3、修复若干bugs

    4.06版升级说明
    1、修复高亮匹配错误
    2、修复弹窗问题
    3、修复其它bugs

    4.04版升级说明
    1、二级网站答案检索支持:魔方格、作业帮、问答库、阿凡题
    2、增加桌面截图的明确选项,屏幕左上角432*768区域作为app区域。

    4.03版升级说明
    1、增加二级链接答案检索功能和配置,答案准确度有了质的飞跃
    2、修复几个bugs 

    3.95版升级说明
    1、增加鼠标划框设置OCR截图区域功能。取消选中缩放区域,点击"选择题干区域"按钮使其高亮,在图片题干区域按下左键划框选择区域,再点击"选择题干区域"按钮,区域数字会自动填入对应的文本框中,点击保存区域或起个新App名字再保存。
    2、如果使用了鼠标划框来设置OCR截图区域,请不要选中区域自动缩放的设置,因为此时的区域数字是图片的实际大小,无需缩放。

    3.94版升级说明
    1、增加有道Ocr选项,部分App如果百度识别不出来可以试试有道Ocr。
    2、保留百度Ocr高精度选项,蚊子虽小也是肉啊!
    3、增加密码保存选项
    4、增加保存App题目图片选项,答题图片保存在程序所在目录的Picture子目录下
    5、修复电脑窗口截图的图片写D盘问题

    3.83版升级说明
    1、加入禁用搜索引擎选项
    2、支持加载TXT格式的题库,TXT题库采用模糊匹配方式,所以不宜过大,以免时间过长。如果题库是简写的内容,注意答案也要简写,不要比OCR的题目选项多字,这样才能在OCR出来的选项里面匹配最可能的答案。用TXT题库答题的,可以考虑禁用搜索引擎
    3、Web窗口加入谷歌引擎

    3.77版升级说明
    1、缩放区域参数写入配置文件
    2、修正若干bugs

    3.75版升级说明
    1、修复题库答案弹窗偶尔看不到的问题
    2、增加高频字和单字的分词选项
    3、修正若干bugs

    3.74版升级说明
    1、开放一定概率的八窗口体验功能,无需密码
    2、去掉部分高频词高亮匹配
    3、增加部分否定词高亮匹配
    4、修正若干bugs
    5、如果发生死机问题,请禁用adb功能,或QQ通知作者

    3.73版升级说明
    1、增加搜索结果标题匹配高亮
    2、修复Web窗口题干+选项搜索bug

    3.72版升级说明
    1、更新网卡检测方式,如果造成code发生变化导致密码失效,请QQ联系作者。
    2、修复题干窗口搜题的高亮匹配错误。
    3、Web窗口点击链接修改为在当前选项卡打开,如果要返回之前的内容,请按Alt+左箭头。
    4、考虑兼容英文app,更改题干标点符号处理方式。升级数据库到3C版,请在启动程序之后重新导入老版本数据库,包括QuestionBank、QuestionBank3、QuestionBank3B这三个文件(如果有的话都导入)。注意:3.61版及之后的版本如果保存过题目,在检索答案时受标点符号的影响可能会失效,此问题无法修复,只能重新答题并保存了,抱歉。
    5、增加扩展名为.config的应用程序配置文件,请确保此文件与exe文件同名。例如:OcrAnswerer3.exe.config

    3.70版升级说明
    1、增加Web窗口选择模式(题目+选项,仅选项,指定网站)

    3.61版升级说明
    1、更新数据库数据规则,老用户请重新导入老版数据库
    2、更新题库答案检索逻辑
    3、修正部分bugs

    3.51版升级说明
    1、Web搜索增加百度知道和百度文库两个固定搜索
    2、修正部分bugs 

    3.4版升级说明
    1、增加横向布局
    2、修正部分bugs

    3.31版升级说明
    1、修正高亮算法(选项全部为字母)
    2、修正部分bugs

    3.23版升级说明
    1、增加禁用ADB连接的功能
    2、增加界面布局保存功能
    3、更新高亮匹配算法,修复几个bugs。

    3.14版升级说明
    1、增加选项分词功能
    2、加入富聊、欢乐答题之类模式的答题选项修正功能
    3、修正若干bugs

    ************************************************************************************************

    3.73及以后版本升级注意:
    配置文件是config.ini,区域文件是OcrAreas.json,数据库文件是QuestionBank3C.db3,这三个文件拷贝到新版目录即可升级。
    老版本的数据库是:QuestionBank.db3,QuestionBank3.db3,QuestionBank3B.db3,如果有这三个文件可以拷贝到新版目录,并在配置中导入。

    也可以将新版的OcrAnswerer3.exe文件拷贝到以前的目录。
    注意个别机器启用了FIPS验证策略,需要OcrAnswerer3.exe.config文件(此文件的文件名应该与本工具文件名一致)

    ************************************************************************************************* 

    OcrAnswerer主要功能说明

    1、本程序支持ADB安卓手机截图、电脑窗口截图(默认为雷电模拟器,支持雷电、夜神和TC)、电脑屏幕左上角截图三种方式。
    2、支持八窗口答题模式(左侧四个搜索题目+选项,右侧四个搜索题目或选项),适应多种类型题目。
    3、手机连接方式支持USB直连和IP连接(需要安卓手机,并在开发者选项里面打开USB调试)。
    4、空格或鼠标左键点击图片抓图及OCR搜题,鼠标右键刷新图片。
    5、支持题目入库功能,点击正确的答案选项自动入库,下次答题可在题库中检索已有题目。
    6、支持TXT自定义题库功能,格式参考压缩包中的样本。
    7、支持百度、搜狗双引擎搜索,并预留多个引擎接口,欢迎定制。
    8、支持百度、有道两个OCR引擎,预留搜狗引擎,欢迎定制。
    9、支持鼠标划框设置OCR区域,可以保存和新增区域设置,也可以用文本编辑器修改OcrAreas.json文件。不需要的App可以通过文件里面的SHOW参数隐藏。默认自带40个1080p分辨率的App截图区域设置。
    10、OCR和分词需要百度文字识别token及自然语言token,请自行申请。链接:http://ai.baidu.com/docs#/Auth/top
    11、支持人工搜索文本框,只填写问题执行歌词搜索,填写问题+逗号+选项+逗号+选项...执行标准搜索。
    12、增加撇号键作为截图的第二快捷键,这个键在键盘左上角,和波浪线是同一个键。
    13、本程序在Windows10系统下测试通过。
    八窗口功能和题库检索需要密码,请联系作者。


    八窗口功能和题库检索需要密码,请联系作者。

    *****************************

    搜索引擎+二级网站答案+Web窗口(百度知道+百度文库)演示----->推荐新手使用此方式答题

    安装说明:
    1、将压缩包解压缩到新目录。
    2、运行OcrAnswerer.exe程序,点击配置按钮,填写百度文字识别和自然语言token,如果需要的话设置手机ip和截图方式,点击保存。
    3、首次运行OcrAnswerer.exe程序,会生成OcrAreas.json文件,用于记录默认的截图区域。
    4、新版中可以在界面中修改区域数字和序号识别方式,并点击保存区域。可以人工修改OcrAreas文件中的SHOW参数隐藏不需要的App。
    5、新版的题库字段与2.x版不同,在配置界面中可以导入老版的数据库(需要密码,请联系作者)。
    6、新版需要安装.net 4.6.2或更高版本框架以及安装32位的VC2017的运行库
    7、本程序建议在1080p分辨率下运行,推荐Windows10操作系统和720p/1080p手机或雷电模拟器。
    *****************************

    Token申请说明:
    http://ai.baidu.com/docs#/Auth/top  点控制台,选择文字识别和自然语言,创建应用。文字识别和自然语言要分开创建,并获得API key和Secret Key。
    将key分别填入配置界面中的相应文本框,然后点击获取token按钮即可,文字识别和Nlp都要填写。

    有道Appkey申请说明
    http://ai.youdao.com/ 登录之后,在文字识别OCR里面申请OCR实例。然后在应用管理里面创建应用,应用平台选API,并绑定之前建好的OCR实例,确定之后,在应用列表里面点击建好的应用名称,即可得到应用ID和应用密钥。


    区域配置说明:

    1、鼠标划框设置OCR区域:不要选中区域自动缩放的设置,点击"选择题干区域"按钮使其高亮,在图片题干区域按下左键划框选择区域,再点击"选择题干区域"按钮使其取消高亮,区域数字会自动填入对应的文本框中,点击保存区域或起个新App名字再保存。
    2、使用默认自带的区域设置:1080p手机可以直接使用。720p手机请点击缩放区域。修改区域配置在界面修改区域数字,然后点击保存区域即可保存到OcrAreas.json文件中。缩放区域功能不是所有的手机分辨率都能用。
    3、模拟器之类的窗口截图可以使用默认自带的区域设置,也可以自己用鼠标划框的方法建立区域数字。前者请将模拟器设置成手机720p,选中缩放区域选项即可使用自带设置了。后者参考鼠标划框设置OCR区域说明。


    Adb连接说明:
    1、打开手机开发者选项,打开Usb调试。通过usb连接手机到电脑,运行安装包中的adbtest.bat进行测试,正常即可使用。
    2、如果要通过ip连接手机,可能需要打开Wifi调试功能,具体参考手机说明。
    3、如果adb连接出现问题,建议百度解决,或使用模拟器、手机投影软件等代替。

    电脑截图说明:
    1、在配置界面中填入模拟器或手机投影软件的类名,可以截取窗口图片。类名请通过Spy++等程序获取。
    2、模拟器推荐调整为720p手机模式。
    3、如果窗口类名错误或不存在,程序会自动截取屏幕左上角432*768区域作为app区域。
    4、电脑截图后,ocr区域需要自行配置。如果使用默认的区域设置,请将模拟器设成720p(选中区域缩放)、1080p模式。

    重要说明:
    如果打开本工具一开始运行正常,截图几次之后变慢或者失去响应,可能是和后台软件冲突,例如火绒。

    在Windows7系统下,连接手机之后设备管理器可能会找不到ADB interface驱动,出现一个黄色叹号。
    可以采用下面两个办法安装驱动:
    1、安装豌豆荚pc端,看看是否手机连接正常。如果正常,请关闭豌豆荚进程之后再使用本程序,否则会导致adb端口冲突。
    2、使用压缩包附带的winusb.inf。这个文件是从windows10中拷贝出来的。需要手动安装
       在设备管理器中,找到黄色叹号的ADB Interface,右击,选择“更新驱动程序软件”。
       在弹出的窗口中选择第二项,也就是“浏览计算机以查找驱动程序软件”,继续选择第二项,也就是“从计算机的设备驱动程序列表中选择”,直接点击“下一步”,选择“从磁盘安装”,点击浏览,选择解压缩出来的winusb.inf文件

    支持四十个直播答题APP
    头脑王者、西瓜-百万英雄、一直播-黄金时刻、花椒-百万赢家、优酷-疯狂夺金、网易新闻-网易大赢家、网易云音乐-爱乐之城,口碑-点题成金、熊猫-一智千金,趣头条-天降财神、必要-抢钱冲顶、掌阅-百万文豪,百度好看视频-答题赢钱、映客-芝士超人、百度-极速挑战、思聪-冲顶大会、腾讯-全民闯关、波波视频-百万超人,京东-全民夺金,凤凰新闻-答题大会,腾讯-百万脑力时代,小猿答题-知识英雄、今晚八点半-百万英雄、核桃-知识王者、丸子-智者争霸、千帆-知识英雄、陌陌-百万选择王、企鹅电竞、YY直播-超凡问答、YY直播-拜托了大脑、天天抓娃娃-黄金达人、懂球帝-谁是懂球帝、微博-我是答题王、车轮驾考通-车轮老司机、识货大赢家-答题赢钱、平安好医生-健康大作战、米赚-米赚冲顶等。

    答题演示:

    题库检索和八窗口功能需要密码,请与作者联系

    题库功能演示

    TXT题库相似度检索

    配置界面

    百度token申请

    有人不会使用窗口截图操作,这里简单说一下:
    1、如果要用模拟器窗口截图,把模拟器调整到720p或1080p,点区域缩放,就可以使用默认的区域设置数字了。如果模拟器不是720p或者1080p的话,你需要自己设置区域数字。
    2、如果用投屏软件,看看能不能把投屏分辨率设置成720p或者1080p,行的话可以直接使用缩放区域。不行的话,自己设置区域数字做截图测试,合适了点保存区域。投屏的窗口大小要固定,位置随意。
    3、答题时,模拟器放在后台,位置随意。但要确保窗口的四个边不要超出屏幕,前台答题软件不要最大化,要让模拟器程序能看到出题。这样才能知道啥时候按空格或右键截图。 投屏软件出题时间看手机即可,所以不需要露出来,其它与模拟器要求相同。

    OcrAnswerer下载

    4.1版  链接:https://pan.baidu.com/s/1Sq68wymDo6JTdN0m2cFL6g 密码:tszg

  • 相关阅读:
    设计模式(九)外观模式Facade(结构型)
    设计模式(八)装饰器模式Decorator(结构型)
    Linux新手生存笔记[1]——Linux目录结构及说明
    设计模式(三)建造者模式Builder(创建型)
    设计模式(七)组合模式Composite(结构型)
    Linux新手生存笔记[0]——写在前面
    给出两个数m和n,求它们的最大公因子,即能够同时整出m和n的最大正整数
    Linux新手生存笔记[2]——vim训练稿
    Linux新手生存笔记[10]——shell脚本基础3函数及常用命令
    设计模式 ( 十二 ) 职责链模式(Chain of Responsibility)(对象行为
  • 原文地址:https://www.cnblogs.com/boonya/p/9510151.html
Copyright © 2011-2022 走看看