zoukankan      html  css  js  c++  java
  • 『TensorFlow』读书笔记_Inception_V3_上

    1.网络背景

    • 自2012年Alexnet提出以来,图像分类、目标检测等一系列领域都被卷积神经网络CNN统治着。接下来的时间里,人们不断设计新的深度学习网络模型来获得更好的训练效果。一般而言,许多网络结构的改进(例如从VGG到RESNET可以给很多不同的计算机视觉领域带来进一步性能的提高。
    • 这些CNN模型都有一个通病:计算量大。最早的AlexNet含有60M个参数,之后的VGGNet参数大致是AlexNet的3倍之多,而14年GoogLe提出的GoogleNet仅有5M个参数,效果和AlexNet不相上下。虽然有一些计算技巧可以减少计算量,但是在无形中会增加模型的复杂度。参数少的模型在一些超大数据量或内存受限的场景下具有很大优势。

    2.卷积的因式分解

    • GoogleNet带来的性能提升很大程度上要归功于“降维”,也就是卷积分解的一种。考虑到网络邻近的激活单元高度相关,因此聚合之前进行降维可以得到类似于局部特征的东西。接下来主要讨论其他的卷积分解方法。既然Inception网络是全卷积,卷积计算变少也就意味着计算量变小,这些多出来的计算资源可以来增加filter-bank的尺寸大小。

    卷积因式分解成小的卷积

    • 卷积核大,计算量也是成平方地增大。假设有一个5*5的卷积核,我们可以Figure1将其分成两次3*3卷积,这样输出的尺寸就一样了。虽然5*5的卷积可以捕捉到更多的邻近关联信息,但两个3*3组合起来,能观察到的“视野”就和5*5的一样了。
      image_1bliiue6u1rtcqad13o5dccsc19.png-46.3kB
    • 进行分解后,原来的Inception结构也相应发生改变(从Figure4变到Figure5)。
      image_1bliiusft10pu1i7god9ov51qthm.png-26.1kBimage_1bliiv24hrop1iigedlej196313.png-35.9kB
    • 还有两个问题,一个是就是这样分解是否会导致表达损失,还有一个是是否要在两个卷积之间添加非线性计算。通过实验表明,因式分解没有带来太大问题,而在卷积之间添加非线性效果也更好。

    卷积因式分解为空间不对称卷积

    • 其实,以上的卷积分解还不是最优策略,3*3卷积还可以进一步分解为1*3和3*1,两个卷积分别捕捉不同方向的信息,参数只有之前的6/9。其实,这个可以推广到n*n卷积的情况,n*n卷积因式分解为1*n和n*1。这个方法在网络前面部分似乎表现欠佳,但在中间层起到很好的效果。
      image_1bliksv3pu8j19p449l462h0o1g.png-44.2kBimage_1blimvkgvbj4ljlc8917t7k9v4h.png-60.4kB

    3.辅助分类器

    • 辅助分类器这个概念在GoogleNet中已经用到了,就是把一些网络中间层提前拿出类进行回归分类,主要目的是为了更有效地回传梯度。作者发现,辅助分类器在其中扮演者regularizer的角色,因为辅助分类器使用了batch normalization后,效果会更好。

    4.降低特征图尺寸

      

    image_1blimk58q1c35r931rfu6so1b692a.png-39.5kB

    • 为了减少计算量且保留特征表达,作者提出一种双线结构,将分别进行池化和步长为2的卷积操作,最后在合并起来(如下图)。
      image_1blimpkgk1v1b19sq1avprs7iu02n.png-45.3kB
  • 相关阅读:
    回到原点 重新感受01背包的魅力 ZerOnePack
    中等·Magry摆什锦糖 buaacoding DP 动态规划
    树形DP初步-真树 buaacoding
    二叉树的最长链长度—DFS buaacoding 树形DP初步-二叉树
    至多可以交易k次的股票交易 (c++)
    至多只能交易两次的股票交易 最大值
    Leetcode 股票交易(c++)
    Android四大组件之—— BroadcastReceiver的使用
    Android四大组件之—— 使用服务进行后台操作
    使用ContentProvider进行应用程序间的数据交互
  • 原文地址:https://www.cnblogs.com/hellcat/p/8058251.html
Copyright © 2011-2022 走看看