zoukankan      html  css  js  c++  java
  • Deeplab v3+的结构的理解,图像分割最新成果

    Deeplab v3+ 结构的精髓:

    1.继续使用ASPP结构, SPP 利用对多种比例(rates)和多种有效感受野的不同分辨率特征处理,来挖掘多尺度的上下文内容信息. 解编码结构逐步重构空间信息来更好的捕捉物体边界.

    2.添加新的解码模块,重构边界信息

    3.尝试使用改进的xception模块(深度可分离卷积结构depthwise separable convolution)来作为网络的骨干,减少参数量。

    结构的简单对比:

    与之前相比,加入了新的解码模块,逐步精确地重构物体的边界。

    其中采用的Xception模块的深度可分离卷积结构如下:由DW+PW组成,参数量和运算成本低。

     

    DeepLabV3+ 提出的解码模块,如图:

    把经过ASPP以及1*1卷积之后的编码特征进行4倍上采样操作,然后拼接从主干网络中得出的相同分辨率的特征,再通过卷积以及上采样得到结果。

    图中绿色圆圈的目的是,从编码过程中得到的特这个可能由多个channels,所以通过1*1的卷积降低channels数目。

    改进的Xception模块:

    第一个为原先的xception模块,第二个为改进的;

    改进的地方:

    • 采用 depthwise separable conv 来替换所有的 max-pooling 操作,以利用 atrous separable conv 来提取任意分辨率的 feature maps.
    • 在每个 3×3 depthwise conv 后,添加 BN 和 ReLU,类似于 MobileNet.

    参考自:https://www.aiuai.cn/aifarm132.html

  • 相关阅读:
    Lesson 3 Nehe
    Lesson 2 Nehe
    Lesson 1 Nehe
    Lesson 1 Nehe
    JavaScript 字符串与数组转换函数[不用split与join]
    华中科大校长:教授被称为“叫兽”是教育的悲哀
    /etc/profile、~/.bash_profile等几个文件的执行过程
    cygwin下遇到system没有执行的问题
    发短信 汉字编码 utf-8 UCS-2BE
    UTF-8与UNICODE的关系及代码转换
  • 原文地址:https://www.cnblogs.com/ywheunji/p/10506858.html
Copyright © 2011-2022 走看看