zoukankan      html  css  js  c++  java
  • Caffe学习记录(十) SegNet等分割网络学习

    图像分割作为计算机视觉的一个方向,广泛应用在各个领域,记录一下学习的过程,以及各个网络的优缺点,不同的地方等。

    最流行的方法是FCN,整个分割的流程大致可以看做如下:

    FCN顾名思义,全卷机网络,就是把fc层都换做1x1的卷积层,channel等价于fc层的输出个数。

    FCN的架构为编码器,和解码器组成,编码器阶段为 卷积+池化的下采样过程, 解码器阶段为卷积+upsampling的过程,最后接上一个1x1的filter进行pixel分类,如下图

     

    上采样的原因: 池化层会丢失图像信息和降低图像分辨率且是不可逆的操作,对图像分割任务有一些影响。上采样可以补足一些图片的信息,但是信息补充的肯定不完全,所以还需要与左边的分辨率比较高的图片相连接起来(直接复制过来再裁剪到与上采样图片一样大小),这就相当于在高分辨率和更抽象特征当中做一个折衷,因为随着卷积次数增多,提取的特征也更加有效,更加抽象。—— jianyuchen23 from zhihu

     

    SegNet的全称是“用于图像分割的深度卷积编码器-解码器架构”

    segnet的上采样是做反向 max pooling, 在做下采样的时候,segnet会记录max pooling的index的位置,剩下的部分用0来填充:

     

  • 相关阅读:
    自定义ViewGroup基础巩固2---onMeasure()学习及综合实现圆形菜单
    Django自定义模板函数
    django迁移:全局、局部
    setup.py
    企鹅去北极熊家里玩
    python插入记录后获取最后一条数据的id
    清除浮动和解决塌陷
    html知识代码
    django模型:为已存在的表建立模型
    django模型:字段和选项
  • 原文地址:https://www.cnblogs.com/ChrisInsistPy/p/9897717.html
Copyright © 2011-2022 走看看