zoukankan      html  css  js  c++  java
  • 图像处理9 选择性搜索(selective search)

    介绍

    以下介绍和算法引用自选择性搜索(selective search)

    一、目标检测 VS 目标识别

    目标识别(objec recognition)是指明一幅输入图像中包含那类目标。其输入为一幅图像,输出是该图像中的目标属于哪个类别(class probability)。而目标检测(object detection)除了要告诉输入图像中包含了哪类目前外,还要框出该目标的具体位置(bounding boxes)。

    在目标检测时,为了定位到目标的具体位置,通常会把图像分成许多子块(sub-regions / patches),然后把子块作为输入,送到目标识别的模型中。分子块的最直接方法叫滑动窗口法(sliding window approach)。滑动窗口的方法就是按照子块的大小在整幅图像上穷举所有子图像块。这种方法产生的数据量想想都头大。和滑动窗口法相对的是另外一类基于区域(region proposal)的方法。selective search就是其中之一!

    二、selective search算法流程

    step0:生成区域集R,具体参见论文《Efficient Graph-Based Image Segmentation》

    step1:计算区域集R里每个相邻区域的相似度S={s1,s2,…} 
    step2:找出相似度最高的两个区域,将其合并为新集,添加进R 
    step3:从S中移除所有与step2中有关的子集 
    step4:计算新集与所有子集的相似度 
    step5:跳至step2,直至S为空

    三、相似度计算

    论文考虑了颜色、纹理、尺寸和空间交叠这4个参数。

    3.1、颜色相似度(color similarity)
    将色彩空间转为HSV,每个通道下以bins=25计算直方图,这样每个区域的颜色直方图有25*3=75个区间。 对直方图除以区域尺寸做归一化后使用下式计算相似度:

    3.2、纹理相似度(texture similarity)

    论文采用方差为1的高斯分布在8个方向做梯度统计,然后将统计结果(尺寸与区域大小一致)以bins=10计算直方图。直方图区间数为8*3*10=240(使用RGB色彩空间)。

    其中,是直方图中第个bin的值。

    3.3、尺寸相似度(size similarity)

    保证合并操作的尺度较为均匀,避免一个大区域陆续“吃掉”其他小区域。

    例:设有区域a-b-c-d-e-f-g-h。较好的合并方式是:ab-cd-ef-gh -> abcd-efgh -> abcdefgh。 不好的合并方法是:ab-c-d-e-f-g-h ->abcd-e-f-g-h ->abcdef-gh -> abcdefgh。

    3.4、交叠相似度(shape compatibility measure)

    3.5、最终的相似度

    实现

  • 相关阅读:
    java javax.annotation.Resource注解的详解
    Struts2注解详解
    HDU 5074-Hatsune Miku(DP)
    Mac下配置Cocos2d-x3.1环境
    POJ 2109 Power of Cryptography
    Swift编程语言学习10—— 枚举属性监视器
    解决:Determining IP Information for eth0 一直停留 无法进入系统
    Bootstrap之表格
    创建和关联内容数据库到指定Web应用程序和站点集
    Ucan23操作系统项目地址
  • 原文地址:https://www.cnblogs.com/qw12/p/9576480.html
Copyright © 2011-2022 走看看