zoukankan      html  css  js  c++  java
  • 深度学习——1×1卷积核理解

    1 - 引入

      在我学习吴恩达老师Deeplearning.ai深度学习课程的时候,老师在第四讲卷积神经网络第二周深度卷积网络:实例探究的2.5节网络中的网络以及1×1卷积对1×1卷积做了较为详细且通俗易懂的解释。现自己做一下记录。

    2 - 1×1卷积理解

      假设当前输入张量维度为6×6×32,卷积核维度为1×1×32,取输入张量的某一个位置(如图黄色区域)与卷积核进行运算。实际上可以看到,如果把1×1×32卷积核看成是32个权重$W$,输入张量运算的1×1×32部分为输入$x$,那么每一个卷积操作相当于一个$Wx$过程,多个卷积核就是多个神经元,相当于一个全连接网络。

      综上,可以将1×1卷积过程看成是将输入张量分为一个个输入为1×1×32的$x$,他们共享卷积核变量(对应全连接网络的权重)$W$的全连接网络。

    3 - 1×1卷积核作用

    3.1 - 放缩$n_c$的大小

      通过控制卷积核的数量达到通道数大小的放缩。而池化层只能改变高度和宽度,无法改变通道数。

    3.2 - 增加非线性

      如上所述,1×1卷积核的卷积过程相当于全连接层的计算过程,并且还加入了非线性激活函数,从而可以增加网络的非线性,使得网络可以表达更加复杂的特征。

    3.3 - 减少参数

      在Inception Network中,由于需要进行较多的卷积运算,计算量很大,可以通过引入1×1确保效果的同时减少计算量。具体可以通过下面例子量化比较。

    3.3.1 - 不引入1×1卷积的卷积操作

      总共需要的计算量为(28×28×32)×(5×5×192)≈ 120 million

    3.3.2 - 引入1×1卷积的卷积操作

      总共需要的计算量为(28×28×16)×(1×1×192)+(28×28×32)×(5×16×16)≈ 12.4 million,明显少于不引入1×1卷积的卷积过程的计算量。其本质我觉得可以理解成,通过1×1卷积操作提取出输入张量的重要特征(相当于降维),然后通过5×5卷积的计算量可以减少很多(减少的比引入1×1卷积所需额外的计算量多多了)。

     4 - 参考资料

    https://web.stanford.edu/class/cs230/

  • 相关阅读:
    [转] JavaScript中的字符串操作
    关于多线程学习的笔记
    [转] jquery 使用方法
    ubuntu下安装tomcat和配置mysql
    [转] 使用CodeViz生成C/C++函数调用关系图
    [转] java中的匿名内部类总结
    [转] Java中继承thread类与实现Runnable接口的区别
    字符串 指针、调试---师傅传授 栈中指针地址 与 堆中数据地址 标准写法
    maven 阿里云节点,速度快
    解决IntelliJ IDEA 创建Maven项目速度慢问题 DarchetypeCatalog
  • 原文地址:https://www.cnblogs.com/CZiFan/p/9490565.html
Copyright © 2011-2022 走看看