图像识别很简单,大家都在雪藏,我没挣到钱,所以我分享了
图像识别分2大类: 相片识别 和 标准图像识别。
相片识别 因角度,旋转,亮度,等变化因素太多, 只能交给深度训练来搞。(应用tensorflow 的缺点很明显,只能调用库。却无法进入库内部。训练时间太长,虽然功能强大,但是好东西未必符合特定的需求。 实现一套自己的深度训练工作量太大,但是一旦搞完。 那就所向披靡,可以控制任何的小细节,偏差。 并降低训练次数。)
要大幅度降低训练时间,或许应该放弃深度训练。 硬着头皮来把各种偏差因素进行处理, 总之太蛋疼。极其考验数学能力。
下面要讨论的是非图像识别。 这个相对简单。本人已经搞定大多数验证码。
非图像识别: 分2类。 可分割, 与 不可分割的。
之前一直认为不可分割的很难弄。 现在本人已经搞定。 因为即便是不可分割的。 我们也可以人为进行分割,然后制作数据库。
比对的时候。全方位比对就可以。 这样不可分割的 也就能归类为 可分割的。
然后重点就是去噪(太变态的噪声,人眼都看不清,这就是自己作死阿。 正常的噪声 通过分析都能筛选出来,即时筛选不出来,最后我们人工筛选。人工分割,总是可以的。然后就能录入数据库)
所以非照片图片的识别,很简单。 就是暴力比对(设计好框架,优化速度,可将时间控制在几秒内)。
之前百度了,很久 只有一个人说过暴力比对。 再辅助极坐标旋转,xy坐标移动。 可以进行模糊比对。 本人使用了交叉熵比对(借鉴了深度训练的思想)。 可以识别 识别库中没有的图像。
但是识别库要上万。万一下的没意义。 做识别库的过程就是联系 打字, 练习五笔。 这2个不过关。 只能是绝望。
还有ps 手动分割粘连图片。 要用最少的操作,最快的快捷键来手动分割 粘连无法分割的图片。 要了老命了。 吐一口老血。