zoukankan      html  css  js  c++  java
  • Caffe学习记录(十) SegNet等分割网络学习

    图像分割作为计算机视觉的一个方向,广泛应用在各个领域,记录一下学习的过程,以及各个网络的优缺点,不同的地方等。

    最流行的方法是FCN,整个分割的流程大致可以看做如下:

    FCN顾名思义,全卷机网络,就是把fc层都换做1x1的卷积层,channel等价于fc层的输出个数。

    FCN的架构为编码器,和解码器组成,编码器阶段为 卷积+池化的下采样过程, 解码器阶段为卷积+upsampling的过程,最后接上一个1x1的filter进行pixel分类,如下图

     

    上采样的原因: 池化层会丢失图像信息和降低图像分辨率且是不可逆的操作,对图像分割任务有一些影响。上采样可以补足一些图片的信息,但是信息补充的肯定不完全,所以还需要与左边的分辨率比较高的图片相连接起来(直接复制过来再裁剪到与上采样图片一样大小),这就相当于在高分辨率和更抽象特征当中做一个折衷,因为随着卷积次数增多,提取的特征也更加有效,更加抽象。—— jianyuchen23 from zhihu

     

    SegNet的全称是“用于图像分割的深度卷积编码器-解码器架构”

    segnet的上采样是做反向 max pooling, 在做下采样的时候,segnet会记录max pooling的index的位置,剩下的部分用0来填充:

     

  • 相关阅读:
    探究操作系统的内存分配(malloc)对齐策略
    三十一个实用的小常识
    防止网页后退
    郁闷的一天
    脑袋不行
    家的开张
    猴子定律
    赴微软onsite!谁有C++/HTML/JavaScript开发工程师推荐?
    卡马克的求平方根函数代码的陷阱
    动作游戏自定义技能探讨
  • 原文地址:https://www.cnblogs.com/ChrisInsistPy/p/9897717.html
Copyright © 2011-2022 走看看