zoukankan
html css js c++ java
全卷积神经网络FCN
卷积神经网络CNN(YannLecun,1998年)通过构建多层的卷积层自动提取图像上的特征,一般来说,排在前边较浅的卷积层采用较小的感知域,可以学习到图像的一些局部的特征(如纹理特征),排在后边较深的卷积层采用较大的感知域,可以学习到更加抽象的特征(如物体大小,位置和方向信息等)。CNN在图像分类和图像检测领域取得了广泛应用。
CNN提取的抽象特征对图像分类、图像中包含哪些类别的物体,以及图像中物体粗略位置的定位很有效,但是由于采用了感知域,
对图像特征的提取更多的是以“一小块临域”为单位的,因此很难做到精细(像素级)的分割
,不能很准确的划定物体具体的轮廓。
针对CNN在图像精细分割上存在的局限性,UC Berkeley的Jonathan Long等人2015年在其论文 “Fully convolutional networks for semantic segmentation”(用于语义分割的全卷积神经网络)中提出了Fully Convolutional Networks (FCN)用于图像的分割,要解决的核心问题就是图像像素级别的分类。论文链接:
https://arxiv.org/abs/1411.4038
FCN与CNN的核心区别就是FCN将CNN末尾的全连接层转化成了卷积层:
以Alexnet为例,输入是227*227*3的图像,前5层是卷积层,第5层的输出是256个特征图,大小是6*6,即256*6*6,第6、7、8层分别是长度是4096、4096、1000的一维向量。
在FCN中第6、7、8层都是通过卷积得到的,卷积核的大小全部是1*1,第6层的输出是4096*7*7,第7层的输出是4096*7*7,第8层的输出是1000*7*7(7是输入图像大小的1/32),即1000个大小是7*7的特征图(称为heatmap)。
经过多次卷积后,图像的分辨率越来越低,,为了从低分辨率的heatmap恢复到原图大小,以便对原图上每一个像素点进行分类预测,需要对heatmap进行反卷积,也就是上采样。论文中首先进行了一个上池化操作,再进行反卷积,使得图像分辨率提高到原图大小:
对第5层的输出执行32倍的反卷积得到原图,得到的结果不是很精确,论文中同时执行了第4层和第3层输出的反卷积操作(分别需要16倍和8倍的上采样),再把这3个反卷积的结果图像融合,提升了结果的精确度:
最后像素的分类按照该点在1000张上采样得到的图上的最大的概率来定。
FCN可以接受任意大小的输入图像,但是FCN的分类结果还是不够精细,对细节不太敏感,再者没有考虑到像素与像素之间的关联关系,丢失了部分空间信息。
查看全文
相关阅读:
DatePicker 日期选择器 split-panels 数组的时候,清空这个费劲啊,最后走的后门
英语音标总结
前台发布地址动态获取 本机地址
SecureCRT windows 登录 linux
The History of the English language 英语语音的起源
iview 部分表单验证
iView 表单验证 如果prop字段和表单里的字段对不上,会触发校验,提示错误信息
hdu4370 0 or 1
即时通讯上手必备知识点
不使用Math.random实现随机数。
原文地址:https://www.cnblogs.com/mtcnn/p/9411681.html
最新文章
maven在mac下的环境变量配置
Redis5设计与源码分析 (第2章 简单动态字符串)
Redis5设计与源码分析 (第1章 引言)
《Redis 5设计与源码分析》笔记
CopyOnWriteArrayList原理分析
InnoDB存储引擎 (第10章 源代码的编译和调试)
InnoDB存储引擎 (第9章 性能调优)
InnoDB存储引擎 (第8章 备份与恢复)
InnoDB存储引擎 (第7章 事务)
InnoDB存储引擎 (第6章 锁)
热门文章
InnoDB存储引擎 (第5章 索引与算法)
screen案例--不合理设置差点搞服务器搞挂了
screen案例--保存当前窗口输出
win32api keybd_event 虚拟键码表
AMD Intel CPU 对比图
ECharts 中国地图 vue
svgMap 中国地图
git 提交本地仓库 提交错误撤销命令
数组动态表单验证,添加数组,逆序添加,表单验证会错位,发现是key的默认index问题,还有验证trigger问题,添加数据会爆红
vue-cli-service build 时间戳 方便查看bug发布时间和项目发布时间对比
Copyright © 2011-2022 走看看