faster rcnn 相比fast rcnn抛弃了原来的滑窗方法,采用了anchor方法。
input是原始图片,经过CNN网络提取特征之后,在特征图的每个点对应的原图位置按照anchor取候选框,得到响应的特征图,然后进行后续的检测分类。流程图如下:
通过上图,可以注意到其训练方式也是有创新的:
四步:
网络结构图:
loss函数:
参考博客:https://senitco.github.io/2017/09/02/faster-rcnn/
具体smooth L1的好处:https://www.zhihu.com/question/58200555,L1 loss对噪声更鲁棒。
参考网址:https://zhuanlan.zhihu.com/p/24916624