zoukankan      html  css  js  c++  java
  • Cluster-based Co-saliency Detection笔记

    1. 两个定义

    • 协同显著性:在一组相似的图像中发现unique object (D. Jacobs 2010)// 从多幅图像中发现共有的显著性
    • 协同分割:将两张或是多张图像中相似的对象分割感出来

    2. co-saliency与co-segmentation之间的区别

    • 在非监督的co-segmentation方法中,图像中的非显著但相似的背景会给corresponding过程带来副作用;
    • 对于有歧义的图像,需要用户的输入来指导分割过程;
    • co-segmentation方法的计算量往往很大,尤其是面对大量的图像的时候。然而很多需求,例如图像缩放,目标定位和识别,对于精度要求往往不是很苛刻,只要能够快速定位出多张图像中的共有对象即可。

    3. 本文所做的工作

    • 基于聚类的co-saliency检测                                                                                                                                            
    • 用的特征是contrast,spatial,correspondence;
    • 优点是基本上是自底向上的,没有繁重的学习过程,而且简单、通用、有效;
    • 在协同分割,鲁棒的图像测距,弱监督学习以及视频前景提取具有广泛的应用前景。

    4. 本文的动机

    单张图像中的显著性检测方法忽视了多张图像中的关联线索,因此,本文将重复属性做为附加约束来发现多张图像中的共有显著对象。所以本文既考虑了单张图像内的显著性(intra-saliency),也考虑了多张图像间表现出的显著性(inter-saliency)。

    5. 方法概述

    符号说明:

    M张图像记为{I^j}_{j=1}^M

    图像I^j中的像素集合记为{p_i^j}_{i=1}^{N_j},其中N_j表示第j个image lattice(不是图像I^j中的像素的个数?);

    对这M张图像进行聚类,得到K个cluster,记为{C^k}_{k=1}^K,聚类中心记为{mu_k}_{k=1}^Kmu_k是D维向量;

    对于图像I^j中每个像素p_i^j以及对应的cluster index b(p_i^j),定义一个映射函数b:mathcal{R}^2
ightarrow {1,...,K}

    {z_i^j}_{i=1}^{N_j}是图像I^j中像素p_i^j的归一化后的位置。

    所用的显著性测度:

    • 特征对比度测度Contrast Cue

        类 C^k 的特征对比度测度w^c(k)定义为类C^k与其他类的特征对比度,形式化描述如下:

                      w^c(k)=sum_{i=1,i
eq k}^Kleft (frac{n^i}{N}||mu^k-mu^i||_2
ight )

    其中N为所有的图像的像素和,n^i为聚类C^i的像素个数。所以,类中像素个数越多,对特征对比度的贡献也就更大。

    特征对比度与直方图对比度之间的不同:

        这里衡量的是cluster的对比度,而直方图对比度衡量的是直方图的对比度;

        对比度测度只是三个显著性测度中的一个。

    特征对比度测度的优点:

        cluster越是独特,cluster越是显著。

    • 中心偏移测度Spatial Cue

        偏移测度的依据是:人类视觉系统中,图像中心区域往往能够在比其他区域更加吸引人的注意。当对象与图像中心之间的距离越大时,显著性也就越来越减小。在单张图像中,称为中央偏向准则(center bias rule)。本文作者对这个概念进行了扩展,将其扩展到基于聚类的方法上。聚类C^k的重心偏移测度w^s(k)定义如下:

             w^s(k)=frac{1}{n^k}sum_{j=1}^{M} sum_{i=1}^{N_j} left[ mathcal{N}left ( ||z_i^j-sigma^j||^2 | 0, sigma^2
ight )cdot delta[b(p_i^j)-C^k]
ight ]

    与单张图像中的中心偏移测度不一样的是,这里定义的是多张图像上的全局中央偏向性。

    • 图间分布测度Corresponding Cue

    图间分布测度主要用于衡量多张图像上的cluster的分布的。重复率描述了一个对象在多张图像上重复出现的频率,是反映协同显著性的一个重要的全局属性。首先采用一个具有M个bin的直方图hat{mathbf{q}}^k={hat{q}_j^k}_{j=1}^M来描述聚类C^k在M张图像中的分布:

        hat{q}_j^k=frac{1}{n^k}sum_{i=1}^{N_j} delta[b(p_i^j)-C^k],j=1,...,M

    然后就可以定义图间分布测度w^d(k):

        w^d(k)=frac{1}{mbox{var}(hat{mathbf{q}}^k)+1}

    在各个图像中分布越是均匀的cluster,对应的图间分布测度就越是大。

    协同显著性图生成:

    对单张图像而言,可以获得contrast cue map,spatial cue map,对于多张图像而言,既可以得到contrast cue, spatial cue,又可以得到corrsponding cue,因此总共可以得到5个cues,对这5个cues进行融合,就可以得到cluster级的协同显著性概率图p(k):

          p(C^k)=prod_i w_i(k)

    其中i=1,...,5

    co-saliency计算出来,相当于得到了离散的assignment,接下来对co-saliency值进行平滑,得到每一个像素的显著性概率。首先得到像素属于聚类C^k的似然概率:

         p(x|C^k)=mathcal{N}(||v_x,mu^k||_2 | 0,sigma^2)

    其中v_x是像素x的特征向量,方差sigma是聚类C^k的方差。

    最后计算每一个像素显著的概率:

        p(x)=sum_{k=1}^K p(x,C^k)=sum_{k=1}^K p(x|C^k)p(C^k)

    6.实验

    参数选择:

    所用特征:CIE Lab颜色特征以及Gabor特征,共4维。Gabor特征的获取过程是:8个方向的Gabor特征,bandwidth为1,然后计算这8个滤波后的图像的幅值,即Gabor_img = sum(abs(Gabor_img).^2, 3).^0.5;  Gabor_img是(img_height*img_width)*8的矩阵。

    单张图像的聚类:用K-means进行聚类,聚类的个数是K_1=6

    多张图像的聚类:K-2=min{3M,20},M是图像的总个数

    测试数据集以及实验结果:

    单张图像的测试数据集:MSRA1000,PR curve优于RC(Cheng Mingming cvpr 2011)

    协同显著性计算的测试数据集:

    Co-saliency Pairs dataset(H. Li, K. Ngan. TIP 2011), PR curve优于CO(K. Chang, CVPR 2011), MS(H. Li, TIP 2011), PC(H. Chen, ICIP 2010)

    CMU iCoseg dataset(D. Batra et al. IJCV 2011), PR curve优于CO.

    7.应用

    协同分割:

    用bilayer segmentation方法在MSRC数据集上进行了测试,方法在segmentation accuracy优于(A. Joulin, CVPR 2010),略逊于(K. Chang, CVPR 2011),但是本文方法的时间开销小,处理4张128*128的图像,(K. Chang, CVPR 2011)所用时间是40s,本文方法只需要5秒。

    具有鲁棒性的图像测距

    弱监督学习

    视频前景提取

  • 相关阅读:
    Java中单态设计模式
    Google地图,Baidu地图数据供应商
    栅格数据和矢量数据
    Java学习之Iterator(迭代器)的一般用法 (转)
    highcharts图表组件入门教程:如何监听柱状图柱子点击事件动态更新当前数据点数值和所对应X轴刻度
    relative、absolute和float
    【转】20个令人敬畏的jQuery插件
    启动tomcat显示成功,但是访问tomcat首页是404错误页
    手机测试Android程序
    Android数据的四种存储方式SharedPreferences、SQLite、Content Provider和File (三) —— SharePreferences
  • 原文地址:https://www.cnblogs.com/qingliu411/p/3541077.html
Copyright © 2011-2022 走看看