zoukankan      html  css  js  c++  java
  • R-FCN:Object Detection via Region-based Fully Convolutional Networks

    fast、faster这些网络都可以被roi-pooling层分成两个子网络:1.a shared,'fully convolutional' subnetwork

                               2.an roi-wise subnetwork(就是does not share computation的子网络)

    其实这样分是因为vgg、resnet是由全连接子网络和卷积子网络组成的,而fast、faster实际上就是在这两个子网络之间添加了roi-pooling和在最后修改了相应loss。

    图像级别的分类任务侧重于平移不变性(在一幅图片中平移一个物体而不改变它的判别结果),物体检测任务需要定义物体的具体位置,因此需要平移变换特性。

    ROI pooling前都是卷积,是具备平移不变性的,但一旦插入ROI pooling之后,后面的网络结构就不再具备平移不变性了,就解决了分类和定位的矛盾,但因为引入roi-wise layer,会牺牲训练和测试的效率。因此,本文想提出来的position sensitive score map这个概念是能把目标的位置信息融合进ROI pooling。

    R-FCN(基于区域的检测器)的方法是:在整个图像上共享计算,通过移除最后的fc层实现(即删除了所有的子网络)。使用“位置敏感的得分图”来解决了图像分类平移不变性与对象检测平移变化之间的矛盾。

          此矛盾为:物体分类要求平移不变性越大越好 (图像中物体的移动不用区分),而物体检测要求有平移变化。所以,ImageNet 分类领先的结果证明尽可能有平移不变性的全卷积结构更受亲睐。另一方面,物体检测任务需要一些平移变化的定位表示。比如,物体的平移应该使网络产生响应,这些响应对描述候选框覆盖真实物体的好坏是有意义的。我们假设图像分类网络的卷积层越深,则该网络对平移越不敏感。

          CNN随着网络深度的增加,网络对于位置(Position)的敏感度越来越低,也就是所谓的translation-invariance,但是在Detection的时候,需要对位置信息有很强的的敏感度。

  • 相关阅读:
    Python笔记(六)- 模型及Django站点管理
    Python笔记(五)--Django中使用模板
    Java中对象的复制
    Echarts堆积柱状图排序问题
    java基础
    java中的重载与重写
    struts2中配置文件的调用顺序
    struts2的工作原理
    拦截器和过滤器的区别
    Struts2中访问web元素的四种方式
  • 原文地址:https://www.cnblogs.com/ymjyqsx/p/7640208.html
Copyright © 2011-2022 走看看