依据:自然场景中的文字笔画倾向于固定的宽度。
检测流程如下图:
笔画宽度的算法如下:
首先将图像中每个像素的笔画宽度值设置为无穷大。
(1)利用边缘检测算子(Canny)对图像I(x,y)进行边缘检测,可以得到每个边缘像素点都具有一个方向梯度值;
(2)假设p为一个边缘像素点,Dp为其梯度方向,按照梯度方向沿着路线r=p+Dp*n(n>=0)寻找另一个边缘象素点q,Dq为这个像素点的梯度方向,Dp和Dq方向相反;
在这个步骤中,如果没有找到q或者二者的梯度方向不是相反的,则重新寻找;找到之后计算||p-q||;
(3)重复步骤(2)找到所有的笔画宽度值。
笔画宽度用于文本定位的原理是:如果相邻像素的笔画宽度大致相等则可能会被合并起来,一般约定2个相邻的笔画宽度比不超过3。
候选区域的筛选步骤如下:
(1)噪声的消除。单个的字符一般不会出现在图像中,出现后按照随机噪声消除。
(2)候选区域的面积。若面积小于20像素被删除。
(3)候选区域的笔画宽度。变化太大的区域将被消除。
(4)候选区域的长宽比。一般在0.1到10之间。
(5)候选区域的字符大小。字符高度像素一般在10-300之间。