目标检测论文解读3——Fast R-CNN - 走看看

zoukankan html css js c++ java

目标检测论文解读3——Fast R-CNN

背景

　　deep ConvNet兴起，VGG16应用在图像分类任务上表现良好，本文用VGG16来解决检测任务。SPP NET存在CNN层不能fine tuning的缺点，且之前的方法训练都是分为多个阶段，特征提取+SVM分类+边框回归，这些问题在Fast R-CNN上都得到了解决。

方法

　　网络模型采用VGG16结构,跟SPP NET相比有如下改进。

　　ROI pooling

　　将最后的max pooling层换成RoI pooling层，可以认为是SPP NET的特殊情况，只有一层金字塔，feature map被分为H*W个bin，作max pooling。

　　bbox regressor

　　网络末尾采用两个不同的全连接层，分别输出分类和位置结果，实现了end-to-end的训练过程。

　　CNNs参数更新

　　其实SPP NET也并不是不能更新CNNs的参数，只是这样开销太大，这是因为SPP NET先是将一堆图片的ROI求出来，打乱后随机取N张训练，这些ROI可能来自于很多不同的图片，这样如果要进行反向传播，必须保存这些图片训练中各层的feature map，开销巨大；Fast R-CNN采用了分层的思想，只在R=2张原图中取N个ROI，这样只用计算存储两张图片，开销大大降低。

总结

　　是在SPP NET的基础上做出的改进，让训练过程变成end-to-end，整个网络的参数都能更新。

缺点

　　ROI的提取采用的还是SS方法。　　

查看全文

相关阅读:
[node.js学习]为node.js写的一个操作mysql的类
 极光IM简单接入步骤
 windows自带的netsh 端口转发
 nodejs 做的带管理后台的东东,主要学习到 ....我忘了学到什么了
 利用来JS控制页面控件显示和隐藏有两种方法
 phpstudy 出现You don't have permission to access / on this server.
禁用input自动填充
 一般充值的流程
 jq传输json字符串
 ECSHOP更改后台顶部图片

原文地址：https://www.cnblogs.com/xin1998/p/11374221.html

Copyright © 2011-2022 走看看