特征
特征为图像中具有代表性的区域, 可以为角点,边缘和区块等。
特征是图像信息的另一种数字表达形式。
特征具有以下性质:
- 可重复性( Repeatability):相同的“区域”可以在不同的图像中被找到。
- 可区别性( Distinctiveness):不同的“区域”有不同的表达。
- 高效率( Efficiency):同一图像中,特征点的数量应远小于像素的数量。
- 本地性( Locality):特征仅与一小片图像区域相关。
特征点由关键点( Key-point)和描述子( Descriptor)两部分组成。
关键点是指该特征点在图像里的位置,有些特征点还具有朝向、大小等信息。
描述子通常是一个向量,按照某种人为设计的方式,描述了该关键点周围像素的信息。
描述子是按照“外观相似的特征应该有相似的描述子”的原则设计的。因此,只要两个特征点的描述子在向量空间上的距离相近,就可以认为它们是同样的特征点。
- SIFT(尺度不变特征变换, ScaleInvariant Feature Transform)
该特征点考虑了在图像变换过程中出现的光照,尺度,旋转等变化,但随之而来的是极大的计算量。
- ORB( Oriented FAST and Rotated BRIEF)特征
该特征点改进了 FAST 检测子 [33] 不具有方向性的问题,并采用速度极快的二进制描述子BRIEF[34],使整个图像特征提取的环节大大加速。
在目前的 SLAM 方案中, ORB 是质量与性能之间较好的折中。
ORB特征
提取 ORB 特征分为两个步骤:提取Fast关键点,和计算BRIEF描述子。
FAST关键点
FAST 是一种角点,主要检测局部像素灰度变化明显的地方,以速度快著称。它的思想是:如果一个像素与它邻域的像素差别较大(过亮或过暗) , 那它更可能是角点。相比于其他角点检测算法, FAST 只需比较像素亮度的大小,十分快捷。
在 FAST-12 算法中,为了更高效,可以添加一项预测试操作,以快速地排除绝大多数不是角点的像素。具体操作为,对于每个像素,直接检测邻域圆上的第 1, 5, 9, 13 个像素的亮度。只有当这四个像素中有三个同时大于 Ip + T 或小于 Ip − T 时,当前像素才有可能是一个角点,否则应该直接排除。这样的预测试操作大大加速了角点检测。
此外,原始的 FAST 角点经常出现“扎堆”的现象。所以在第一遍检测之后,还需要用非极大值抑制( Non-maximal suppression),在一定区域内仅保留响应极大值的角点,避免角点集中的问题。
FAST 特征点数量很大且不确定,而我们往往希望对图像提取固定数量的特征。我们可以指定最终要提取的角点数量N,对原始 FAST 角点分别计算 Harris 响应值,然后选取前 N 个具有最大响应值的角点,作为最终的角点集合。
针对 FAST 角点不具有方向性和尺度的弱点, ORB 添加了尺度和旋转的描述。尺度不变性由构建图像金字塔‹,并在金字塔的每一层上检测角点来实现。而特征的旋转是由灰度质心法( Intensity Centroid)实现的。
BRIEF 描述子
BRIEF 是一种二进制描述子,它的描述向量由许多个 0 和 1 组成,这里的 0 和 1 编码了关键点附近两个像素(比如说 p 和 q)的大小关系:如果 p 比 q 大,则取 1,反之就取 0。
如果我们取了 128 个这样的 p; q,最后就得到 128 维由 0, 1 组成的向量。
BRIEF 使用了随机选点的比较,速度非常快,而且由于使用了二进制表达,存储起来也十分方便,适用于实时的图像匹配。
原始的 BRIEF 描述子不具有旋转不变性的,因此在图像发生旋转时容易丢失。而 ORB 在 FAST 特征点提取阶段计算了关键点的方向,所以可以利用方向信息,计算了旋转之后的“ Steer BRIEF”特征,使 ORB 的描述子具有较好的旋转不变性。
特征匹配
描述子距离表示了两个特征之间的相似程度,不过在实际运用中还可以取不同的距离度量范数。对于浮点类型的描述子,使用欧氏距离进行度量即可。而对于二进制的描述子(比如 BRIEF 这样的),我们往往使用汉明距离( Hamming distance)做为度量——两个二进制串之间的汉明距离,指的是它们不同位数的个数。
最简单的特征匹配方法就是暴力匹配( Brute-Force Matcher) 。即对每一个特征点 xm t ,与所有的 xn t+1测量描述子的距离,然后排序,取最近的一个作为匹配点。
快速近似最近邻( FLANN) 算法更加适合于匹配点数量极多的情况。