zoukankan      html  css  js  c++  java
  • PSPnet:Pyramid Scene Parsing Network——作者认为现有模型由于没有引入足够的上下文信息及不同感受野下的全局信息而存在分割出现错误的情景,于是,提出了使用global-scence-level的信息的pspnet

    from:https://blog.csdn.net/bea_tree/article/details/56678560

    首先声明,文末彩蛋,不是笔者提问的

    1 一句话总结

    作者认为现有模型由于没有引入足够的上下文信息及不同感受野下的全局信息而存在分割出现错误的情景,于是,提出了使用global-scence-level的信息的pspnet,另外本文提出了引入辅助loss的ResNet优化方法。

    2 网络结构

    本文提出的网络结构简单来说就是将DeepLab(不完全一样)aspp之前的feature map pooling了四种尺度之后 将5种feature map concat到一起经过卷积最后进行prediction的过程。
    这里写图片描述

    3 ResNet

    本文除了网络之外,其ResNet的模型还是挺强的
    这里写图片描述
    这里写图片描述
    如上图,首先作者在训练的时候加入了辅助loss,另外ResNet起始的7x7的卷积替换了三个3x3的卷积

    4 实施细节

    • 使用了poly的学习策略,learning rate 0.01,power 0.9
    • momentum 0.9 weight decay 0.0001
    • random mirror
    • random resize [0.5,2]
    • random rotation [-10 degree,10 degree]
    • random gaussian blur
    • new caffe (batch size 16)
    • auxiliary loss weight to 0.4

    5 Ablation study

    作者通过实验,验证了文中各种设置的作用

    5.1 psp net的作用(包括pooling的形式及数量)

    这里写图片描述

    5.2 auxiliary loss

    这里写图片描述

    5.3 pre-trained model

    这里写图片描述

    5.4 其他

    这里写图片描述

    6 知乎上的讨论

    这里写图片描述

    这里写图片描述

  • 相关阅读:
    hdu 2296 AC自动机+DP+路径字符串记录(较麻烦)
    HDU
    hdu 2243(poj2778的加强版!(AC自动机+矩阵))
    Poj3691(AC自动机+DP(简单题))
    后台样式升级1.
    那些可以在数据库里做的事:分页与过滤
    常用的几个单页应用程序网站分享
    Javascript生成二维码(QR)
    户端页面中读取串口操作
    GridView事件分析
  • 原文地址:https://www.cnblogs.com/bonelee/p/9031710.html
Copyright © 2011-2022 走看看