FPN网络结构:
识别不同大小的物体是计算机视觉中的一个基本挑战,FPN网络中包含自底向上跟自上而下两部分。
(1)自底向下:自底向上的过程就是神经网络普通的正向传播过程。
(2)自上而下:语义更强的高层特征图进行上采样,然后把该特征图横向连接至前一层特征,高层特征得到增强,每一层预测所用的feature map都融合了不同分辨率,不同语义强度的特征,可以完成对应分辨率大小的物体进行检测,保证每一层都有合适的分辨率以及强语义特征。
这样做的目的是因为低层特征可以提供更加准确的位置信息,而多次的降采样和上采样操作使得深层网络的定位信息存在误差,因此我们将其结合其起来使用,这样我们就构建了一个更深的特征金字塔,融合了多层特征信息,并在不同的特征进行输出。