集装箱体本身的特征有三,一是图片中的需要识别的文字比较大;二是需要识别的文字色彩鲜艳;三是文字周围的干扰比较多,所以直接识别,即使是使用finereader这种软件都无法完成。
所以,第一步需要做的就是更换图片区域,强调联通。比如这样的结果
再强化
这个时候即使是识别成这样,都无法ocr,因为细节太多了。
怎么办?缩放,把字母缩放到和它训练的时候差不多时候的样子。
得到结果,下一步就是自己写这个OCR步骤,这也是可以做到的。
再举一个例子,这种竖直的shib