Pyramid scene parsing network. In Proc. CVPR, pages 2881–2890, 2017
目的:扩大感受野,尽可能的利用全局上下文信息(某种程度上,可以认为感受野大小可以认为是对上下文信息利用的程度)。
做法:
1.对骨干提取的feature map(channel =N)做池化得到特征金字塔,
2.然后通过1*1深度卷积降通道分别得到1*1,2*2,4*4,6*6的channel = 1/N的特征图
3.对特征图进行双线性插值填充上采样到原Feature map尺寸
4.与Feature map进行通道拼接(也叫级联)得到channel数增加1倍的特征图
5.再利用1*1卷积核将上述拼接后的特征图 深度卷积降通道 得到与输入特征图Feature通道数一致的最终的语义分割预测结果。