卷积和反卷积详细说明 - 走看看

zoukankan html css js c++ java

卷积和反卷积详细说明
转载:https://zhuanlan.zhihu.com/p/124626648

转载：https://www.cnblogs.com/wanghui-garcia/p/10791328.html

1. 卷积 Convolution

1.1 卷积输出尺寸

输出图像尺寸可以根据以下公式获得

$o = frac{i+2p-k}{s} +1$
- $i$ ：输入图像尺寸
- $p$ : padding 大小
- $k$ : 卷积核大小
- $s$ : 步长
卷积：蓝色的输入图片（4 x4）,深蓝色代表卷积核（3 x 3）,绿色为输出图像（2 x 2）

假如现在有一个4 x 4的图片, 使用一个3 x 3的kernel 进行卷积

图片： $I = egin{equation} left[egin{array}{llll}x_{1} & x_{2} & x_{3} & x_{4} \ x_{5} & x_{6} & x_{7} & x_{8} \ x_{9} & x_{10} & x_{11} & x_{12} \ x_{13} & x_{14} & x_{15} & x_{16}end{array} ight] end{equation}$ 卷积核： $egin{equation} left[egin{array}{lll}w_{0,0} & w_{0,1} & w_{0,2} \ w_{1,0} & w_{1,1} & w_{1,2} \ w_{2,0} & w_{2,1} & w_{2,2}end{array} ight] end{equation}$

strides = 1 , padding = 0, 卷积后，输出图像的尺寸为 $2 imes 2$

如果卷积核很大，那么可以使用傅里叶变换, 提升卷积的性能。

2. 反卷积 Transposed Convolution

由于卷积核一般比原始图像小，所以卷积之后的图像尺寸往往会变小。有时候我们需要将卷积后的图像还原成原始图像的尺寸，即实现图像从小分辨率到大分辨率的映射，这种操作就叫做上采样（Upsampling）。而反卷积正是一种上采样方法。

反卷积，又称为转置卷积（Transposed Convolution,），它是一种特殊的卷积，先padding来扩大图像尺寸，紧接着跟正向卷积一样，旋转卷积核180度，再进行卷积计算。看上去就像，已知正向卷积的输出图像，卷积核，得到正向卷积中的原始图像（并非真的得到原始图像，像素点是不一样的，但是尺寸是一致的）。

它看上去像是正向卷积的逆运算，但其实并不是。因为反卷积只能还原原始图像的尺寸，但是并不能真的恢复原始图像内容，即每个元素值其实是不一样的。

卷积过程中：

$o$ 表示输出， $i$ 表示输入， $k$ :表示kernel的大小， $p$ ：表示padding, $s$ : 表达strides

反卷积过程中：

$o^{'}$ 表示输出， $i^{'}$ 表示输入， $k^{'}$ :表示kernel的大小， $p^{'}$ ：表示padding, $s^{'}$ : 表达strides

卷积后的 $o$ 则反卷积的 $i^{'}$ , 一般卷积核是不会变的， $k=k^{'}$ ，需要注意的是，卷积与反卷积的padding很可能是不一样。

2.1 Striding

反卷积的Striding跟卷积有点不一样，它在输入的每个元素之间插入 $s^{'} -1$ 个值为0的元素

Transposed convolution : Striding

如果我们将反卷积看成是一种特殊的卷积，它其实是根据反卷积中指定的步长strides, 修改了输入 $i^{'}$ , 根据strding 进行补0操作，得到 $I_s$ , 其大小变为 $i^{'}_s = i^{'} + (s^{'}-1) imes(i^{'}-1)$ , 然后对 $I_s$ 进行s=1的卷积。例如，对应上面的三个子图， $s^{'}=1$ 对应的 $i^{'}_s = 3$ , $s^{'}=2$ 对应的 $i^{'}_s = 5$ ， $s^{'}=3$ 对应的 $i^{'}_s = 7$ 。

反卷积：蓝色是输入（3 x 3）, 灰色是卷积核（3 x 3）, 绿色是输出（5 x 5），padding=1，strides = 2

反卷积：蓝色是输入（5 x 5）, 灰色是卷积核（3 x 3）, 绿色是输出（5 x 5），padding=1，strides =1

3 反卷积的输出尺寸

可见这里没考虑output_padding

output_padding的作用：可见nn.ConvTranspose2d的参数output_padding的作用.

论文 A guide to convolution arithmetic for deep learning 涉及了14种有关反卷积的尺寸大小公式的关系，但是归纳起来就只有两种情况。

3.1 $(o^{'} + 2p - k) \% s = 0$

反卷积的输出尺寸为 $o^{'} = s(i^{'} -1) + k -2p$ 或者 $o^{'} = s(i^{'} -1) + 2 + 2p^{'} - k^{'}$

对应上面提到的卷积的例子，分别用上面两条公式进行验算，验算结果都成立。

卷积时， $i=4$ , $k=3$ , $p=0$ , $s=1$ , 所以计算的结果 $o=2$

反卷积， $i^{'} = 2$ , $k^{'}=k=3$ , $p^{'} = 2$ , $s^{'} = 1$ ,

代入第一个式子 $o^{'} = 1 imes(2-1) + 3 - 2 imes 0 = 4$

代入第二个式子 $o^{'} = 1 imes (2-1) + 2 + 2 imes 2 - 3 = 4$

反卷积，蓝色是输入（2 x 2）, 灰色是卷积核（3 x 3）, 绿色是输出（4 x 4），padding=2

4.下面举例说明

https://github.com/vdumoulin/conv_arithmetic#convolution-arithmetic

1）当stride=1时，就不会进行插值操作，只会进行padding，举例说明：

卷积操作为：

蓝色为输入特征图H_in*H_in=4*4，绿色为输出特征图H_out*H_out=2*2，卷积核kernel_size=3, stride=1

根据式子H_out = floor( H_in + 2*padding - kernel_size / stride) + 1

可得padding=0

其对应的逆卷积操作为：

蓝色为输入特征图H_out*H_out=2*2，绿色为输出特征图H_in*H_in=4*4，卷积核kernel_size=3, stride=1

卷积时的padding=0

将这些值代入上面的式子H_in = (H_out- 1) * stride - 2*padding + kernel_size

果然输入H_out*H_out=2*2能得到输出H_in*H_in=4*4

变形过程为：

padding_new = kernel_size - padding -1 = 3 -0 -1 = 2

所以可见下方的蓝色最后的大小为7*7 = H_out + 2*padding_new = 2 + 2*2 = 6

⚠️这里可见是有padding的，为什么定义是为no padding呢？

这是因为它对应的卷积操作的padding=0

1）当stride=2时，进行插值和padding操作，举例说明：

卷积操作为：

蓝色为输入特征图H_in*H_in=5*5，绿色为输出特征图H_out*H_out=3*3，卷积核kernel_size=3, stride=2

根据式子H_out = floor( H_in + 2*padding - kernel_size / stride) + 1

可得padding=1

其对应的逆卷积操作为：

蓝色为输入特征图H_out*H_out=3*3，绿色为输出特征图H_in*H_in=5*5，卷积核kernel_size=3,stride=2

卷积时的padding=1

将这些值代入上面的式子H_in = (H_out- 1) * stride - 2*padding + kernel_size

果然输入H_out*H_out=3*3能得到输出H_in*H_in=5*5

变形操作为：

H_{out_new} = H_out+ (stride-1) * (H_out-1) = 3 + (2-1)*(3-1) = 5

padding_new = kernel_size - padding -1 = 3 -1 -1 = 1

所以可见下方的蓝色最后的大小为7*7 = H_{out_new} + 2*padding_new = 5 + 2*1 = 7

⚠️因为这里的逆卷积对应的卷积操作的padding= 1，所以这里不是no padding,而是padding
查看全文

相关阅读:
firefox远程调试
 PHP使用unset销毁变量并释放内存(转)
去掉超级链接的虚线框
 如何减少 reflow（回流）和 repaint（重绘）
Chrome远程调试
 3大mobile浏览器远程调试
 IE6下使用滤镜后链接无法点击的BUG
让IE6区块元素具备display:inlineblock属性
 Call to undefined function curl_init()解决方法(转)
CSS3 Gradient

原文地址：https://www.cnblogs.com/hansjorn/p/14767592.html

Copyright © 2011-2022 走看看