R-FCN：Object Detection via Region-based Fully Convolutional Networks

zoukankan html css js c++ java

R-FCN：Object Detection via Region-based Fully Convolutional Networks

fast、faster这些网络都可以被roi-pooling层分成两个子网络：1.a shared,'fully convolutional' subnetwork

　　　　　　　　　　　　　　　　　　　　　　　　　　　2.an roi-wise subnetwork（就是does not share computation的子网络）

其实这样分是因为vgg、resnet是由全连接子网络和卷积子网络组成的，而fast、faster实际上就是在这两个子网络之间添加了roi-pooling和在最后修改了相应loss。

图像级别的分类任务侧重于平移不变性（在一幅图片中平移一个物体而不改变它的判别结果），物体检测任务需要定义物体的具体位置，因此需要平移变换特性。

ROI pooling前都是卷积，是具备平移不变性的，但一旦插入ROI pooling之后，后面的网络结构就不再具备平移不变性了，就解决了分类和定位的矛盾，但因为引入roi-wise layer，会牺牲训练和测试的效率。因此，本文想提出来的position sensitive score map这个概念是能把目标的位置信息融合进ROI pooling。

R-FCN(基于区域的检测器）的方法是：在整个图像上共享计算，通过移除最后的fc层实现(即删除了所有的子网络)。使用“位置敏感的得分图”来解决了图像分类平移不变性与对象检测平移变化之间的矛盾。

此矛盾为：物体分类要求平移不变性越大越好 (图像中物体的移动不用区分)，而物体检测要求有平移变化。所以，ImageNet 分类领先的结果证明尽可能有平移不变性的全卷积结构更受亲睐。另一方面，物体检测任务需要一些平移变化的定位表示。比如，物体的平移应该使网络产生响应，这些响应对描述候选框覆盖真实物体的好坏是有意义的。我们假设图像分类网络的卷积层越深，则该网络对平移越不敏感。

CNN随着网络深度的增加，网络对于位置（Position）的敏感度越来越低，也就是所谓的translation-invariance，但是在Detection的时候，需要对位置信息有很强的的敏感度。

查看全文

相关阅读:
图形合并
 启动脚本
 图形合并
 :(){:|:&};:
C言语教程第八章:列举,位运算(5)
C言语图形情势编程，赋性鼠标(4)
C言语教程第十章:文件(6)
C言语教程第十章:文件(4)
红帽为什么要连结桌面Linux
阶乘较劲争论器改善版

原文地址：https://www.cnblogs.com/ymjyqsx/p/7640208.html