CNN 卷积神经网络中的接受视野（Receptive Field） - 走看看

zoukankan html css js c++ java

CNN 卷积神经网络中的接受视野（Receptive Field）
在卷积神经网络中，感受野定义：CNN每一层输出的特征图上的像素点在原始图像
上的映射的区域大小。

RF （receptive field）描述了两个特征映射（Feature Maps）上神经元的关系，在进行 CNN 可视化的过程中非常有用。他也可以从侧面让我们了解，

为什么神经网络偏向于选择小的 Filter 和 Stride。假设，A 经过一系列的操作之后得到 B，那么 B 上的一个区域就只和 A 上的一个区域相关。

一个输入大小为 11×11的A，经过一个过滤器大小为 3×3，步长为 1 的卷积核卷积之后，得到一个大为9×9的特征映射。

可以看到在 B 中一个 3×3 的区域，在 A 中的感受视野为 5×5。B 经过一个大小为 3×3 ，步长为 1 的卷积核卷积之后，得到一个 7×7 的特征映射。

因此在 A 中的一个 5×5 的区域在 B 中的视野就为 3×3。因此，C 中一个 1×1 的区域在 A 的视野就为 5×5。

计算公式为： $r_i=s_i.(r_{i+1}-1)+k_i$

其中 $r_i$ 表示第 i 层输入的一个区域， $s_i$ 表示第 i 层的步长， $k_i$ 表示第 i 层卷积核的大小（filter size）。此计算不需要考虑 padding size。

高层在低层中的视野

计算 C 在 B 中的视野

如我们想计算 C 的一个 1×1 的区域在 B 上的接受视野，从上图可以知道一共三层（两个卷基层一个输入层，此处将输入层的 i 当做0处理），此时我们求的是 $r_2$ 在 $r_1$ 上的感受视野。

由上图可以知道， $s_1$ 的值为 1 因为第一层的步长为 1 ； $k_1$ 的值为 3 ，因为卷积核的大小为 3×3；此时选择的 $r_2$ 区域大小为 1×1，因此它的值为 1 。

通过上述公式计算可得： $r_1=s_1.(r_2-1)+k_1 = 1.(1-1)+3=3$

即 $r_2$ 在 $r_1$ 的接受视野为 3×3 的区域。

计算 B 在 A 中的视野

计算 B 中一个 3×3 的区域在 A 中接受视野。可知 $s_0$ 为 1； $r_1$ 为 3，因为我们选择的 B 的区域为 3×3； $k_0$ 为 3。

因此 B 在 A 中的接受视野为： $r_0=s_0.(r1-1).k_0 = 1.(3-1)+3=5$

计算 C 在 A 中的视野

计算 C 中一个1×1的区域在 A 中的接受视野。

通过以上的计算，我们可以通过如下过程推断：
1. 计算 C 在 B 中的接受视野
$r_1=s_1.(r_2-1)+k_1 = 1.(1-1)+3=3$

2.计算 B 在 A 中的接受视野

此阶段需要将上面计算出来的结果当做 B 中需要计算的区域，因此就有：

$r_0=s_0 cdot (r1-1) cdot k_0 = 1 cdot (3-1)+3=5$

因此可以得到 C 中一个 1×1 的区域在 A 中的接受视野为 5×5

注：以上的计算适用于卷积层和池化层，在激活层中 $r_i=r_{i+1}$

conv5: $r_6= s_6 cdot (r_7-1)+k_6=1 cdot (1-1)+3=3$

conv4: $r_5= 1 cdot (3-1)+3=5$

conv3: $r_4=1 cdot (5-1)+3=7$

pool2: $r_3=2 cdot (7-1)+3=15$

conv2: $r_2=1 cdot (15-1)+5=19$

pool1: $r_1=2 cdot (19-1)+3=39$

conv1: $r_0=4 cdot (39-1)+11=163$

因此第5层卷积在输入层的感受视野为 163。
查看全文

相关阅读:
Enterprise Solution 界面设计规范
 大型.NET商业软件代码保护技术技术与实践相结合保护辛苦创造的劳动成果
 开源WinForms界面开发框架Management Studio 选项卡文档插件 Office 2007蓝色风格后台线程
 解析Visual Studio 2015促进生产力的10个新功能
 LLBL Gen Pro 4.2 Lite 免费的对象关系映射开发框架与工具
 Windows Server 2012部署Enterprise Solution 5.4
ASP.NET MVC：some benefits of asp.net mvc
Python：Opening Python Classes
ASP.NET MVC：4 Ways To Prevent Duplicate Form Submission（转载）
架构：The Onion Architecture : part 3（洋葱架构：第三篇）（转载）

原文地址：https://www.cnblogs.com/tingtin/p/12643725.html

Copyright © 2011-2022 走看看