图像识别的一个核心问题是图像的特征提取,简单描述即为用一组简单的数据(图像描述量)来描述整个图像,这组数据越简单越有代表性越好。良好的特征不受光线、噪点、几何形变的干扰。图像识别发展几十年,不断有新的特征提出,而图像不变矩就是其中一个。
1、HU距
图像的hu矩是一种具有平移、旋转和尺度不变性的图像特征
普通矩的计算:
f(x,y)的p+q阶原点矩可以表示为
而数字图像是一个二维的离散信号,对上述公式进行离散化之后:
其中C与R分别表示图像的列与行。
各阶矩的物理意义:
0阶矩(m00):其中零阶矩与物体的质量有关(目标质量)
1阶矩(m01,m10):与形状有关,(零阶矩与一阶矩可以求出重心)
2阶矩(m02,m11,m20):二阶矩显示曲线围绕直线平均值的扩展程度
3阶矩(m03,m12,m21,m30):三阶矩则是关于平均值的对称性的测量。
但是目标区域往往伴随着空间变换(平移,尺度,旋转),所以需要在普通矩的基础上构造出具备不变性的矩组—hu矩。
由零阶矩和一阶矩计算质心
由二阶距计算图像方向
利用二阶和三阶规格中心矩可以导出下面7个不变矩组,它们在图像平移、旋转和比例变化时保持不变。
由Hu矩组成的特征量对图片进行识别,优点就是速度很快,缺点是识别率比较低。Hu不变矩一般用来识别图像中大的物体,对于物体的形状描述得比较好,图像的纹理特征不能太复杂,像识别水果的形状,或者对于车牌中的简单字符的识别效果会相对好一些。
补充:不变矩的物理含义
如果把图像看成是一块质量密度不均匀的薄板,其图像的灰度分布函数f(x,y)就是薄板的密度分布函数,则其各阶矩有着不同的含义,如零阶矩表示它的总质量;一阶矩表示它的质心;二阶矩又叫惯性矩,表示图像的大小和方向。事实上,如果仅考虑阶次为2的矩集,则原始图像等同于一个具有确定的大小、方向和离心率,以图像质心为中心且具有恒定辐射率的椭圆。当密度分布函数发生改变时,图像的实质没有改变,仍然可以看做一个薄板,只是密度分布有所改变。虽然此时各阶矩的值可能发生变化,但由各阶矩计算出的不变矩仍具有平移、旋转和尺度不变性。通过这个思想,可对图像进行简化处理,保留最能反映目标特性的信息,再用简化后的图像计算不变矩特征,可减少计算量。