目标识别(objec recognition)是指明一幅输入图像中包含哪类目标。其输入为一幅图像,输出是该图像中的目标属于哪个类别(class probability)。
目标检测(object detection)除了要告诉输入图像中包含哪类目标外,还要框出该目标的具体位置(bounding boxes)。
滑窗法是一种经典的物体检测方法。滑窗法的原理:首先对输入图像进行不同窗口大小的滑窗进行从左往右、从上到下的滑动。每次滑动时候对当前窗口执行分类器(分类器是事先训练好的)。如果当前窗口得到较高的分类概率,则认为检测到了物体。对每个不同窗口大小的滑窗都进行检测后,会得到不同窗口检测到的物体标记,这些窗口大小会存在重复较高的部分,最后采用非极大值抑制(Non-Maximum Suppression, NMS)的方法进行筛选。最终,经过NMS筛选后获得检测到的物体。
选择性搜索(Selective Search)是主要运用图像分割技术来进行物体检测。选择搜索算法的原理:图像中物体可能存在的区域应该是有某些相似性或者连续性区域的。因此,选择搜索基于上面这一想法采用子区域合并的方法进行提取bounding boxes候选边界框。首先,对输入图像进行分割算法产生许多小的子区域。其次,根据这些子区域之间相似性(相似性标准主要有颜色、纹理、大小等等)进行区域合并,不断的进行区域迭代合并。每次迭代过程中对这些合并的子区域做bounding boxes(外切矩形),这些子区域外切矩形就是通常所说的候选框。