理解图像分割中的卷积（Understand Convolution for Semantic Segmentation）

zoukankan html css js c++ java

理解图像分割中的卷积（Understand Convolution for Semantic Segmentation）
以最佳的101 layer的ResNet-DUC为基础，添加HDC，实验探究了几种变体：
- 无扩张卷积(no dilation)：对于所有包含扩张卷积，设置 $r = 1$
- 扩张卷积(dilation Conv )：对于所有包含扩张卷积，将2个block和为一组，设置第一个block的 $r = 2$
- Dilation-RF：对于 $r e s 4 b$
- Dilation-Bigger：对于 $r e s 4 b$
可以看到增加接收野大小会获得较高的精度。如下图所示：

ResNet-DUC-HDC在较大的目标物上表现较好。下图是局部放大：

可以看到HDC有效的消除”gridding”产生的影响。

Deeper Networks：同样尝试了将ResNet-101切换为ResNet-152，使用ResNet152先跑了10个epoch学习了BN层参数，再固定BN层，跑了20个epochs.结果如下：

ResNet152为基础层的有1%的提升。

Test Set Results：论文将ResNet101开始的 $7 \times 7$

模型同时在coarse labels跑了一圈，与同样以deliated convolution为主的DeepLabv2相比，提升了9.7%.

KITTI Road Segmentaiton

KITTI有289的训练图片和290个测试图片。示例如下：

因为数据集有限，为了避免过拟合。论文以100的步长在数据集中裁剪 $320 \times 320$

结果达到了state-of-the-art水平.

PASCAL VOC2012 dataset

先用VOC2012训练集和MS-COCO数据集对ResNet-DUC做预训练。再使用VOC2012做fine-tune。使用的图片大小为 $512 \times 512$

可视化结果如下：

Conclusion

论文提出了简单有效的卷积操作改进语义分割系统。使用DUC恢复上采样丢失的信息，使用HDC在解决”gridding”的影响的同时扩大感受野。实验证明我们的框架对各种语义分割任务的有效性。
查看全文

相关阅读:
iScroll.js 用法参考
 行内元素和块级元素
 struct和typedef struct彻底明白了
 C/C++语法知识：typedef struct 用法详解
 不是技术牛人，如何拿到国内IT巨头的Offer （转载）
笔试客观题-----每天收集一点点
 <C++Primer>第四版阅读笔记第一部分 “基本语言”
<C++Primer>第四版阅读笔记第四部分 “面向对象编程与泛型编程”
<C++Primer>第四版阅读笔记第三部分 “类和数据抽象”
<C++Primer>第四版阅读笔记第二部分 “容器和算法”

原文地址：https://www.cnblogs.com/ansang/p/9003513.html

理解图像分割中的卷积（Understand Convolution for Semantic Segmentation）

KITTI Road Segmentaiton

PASCAL VOC2012 dataset

Conclusion