成功的因素:
1.级联而非并联检测器
2.提升iou阈值训练级联检测器的同时不带来负面影响
核心思想:
区分正负样本的阈值u取值影响较大,加大iou阈值直观感受是可以增加准确率的,但是实际上不是,因为这时候正负样本不均衡,所以要做出改变;
所以得出的cascade R-CNN由一系列的检测模型组成,每个检测模型都基于不同IOU阈值的正负样本训练得到,
前一个检测模型的输出作为后一个检测模型的输入(高Iou的输入proposal能得到搞得output iou,且都是大于输入的),因此是stage by stage的训练方式,而且越往后的检测模型,其界定正负样本的IOU阈值是不断上升的。
从图c可以看出,当一个检测模型采用某个阈值(假设u=0.6)来界定正负样本时,那么当输入proposal的IOU在这个阈值(u=0.6)附近时,
该检测模型比基于其他阈值训练的检测模型的效果要好,所以每个检测模型用的IOU阈值要尽可能和输入proposal的IOU接近。
图d的意思是,u表示训练检测模型时所用来区分正负样本的iou阈值;每条彩色线表示不同Iou训练出来的检测模型;
横坐标表示在检测的时候改变区分是否输出为目标的iou阈值,就是最后一步判断是否输出的阈值;
设计的结构如图4,前面的是其他的改进思路,采用这种结构的好处是,大的iou输入得到大的iou输出,每个stage的检测器针对某一范围iou的proposal来检测。
实验得到的结论有:1.仅有0.5的阈值设置并不能获得非常准确的检测,
2.精确的检测需要有适合检测器质量的假设框,(requires hpypotheses that match the detector quality)
思考:能否将这一cascade思想迁移到SSD的检测框架中?
参考自: