zoukankan      html  css  js  c++  java
  • CV baseline之GoogLeNet

    作业内容

    1:文字回答:GoogLeNet采用了几个辅助损失?辅助损失函数的权重是多少?为什么要采用辅助损失函数?

    在Inception4b和Inception4e增加两个辅助分类层,用于计算辅助损失,对于每种辅助损失,论文中使用的权重值为0.3。作用:loss回传;充当正则约束,迫使中间层特征也能具备分类能力

    2:文字回答:Inception模块中有几个分支?分别是哪些操作?Inception模块输出时特征图采用什么方式融合?

    4个分支,1)有128个卷积核的1x1卷积  2)进行64个卷积核的1x1卷积,然后192个卷积核的3x3卷积 3)64个卷积核的1x1卷积,96个卷积核的5x5卷积  4)3x3 pool层,64个卷积核的1x1卷积

    特征融合:GoogLeNet应用了赫布理论(the Hebbian principle:一起激发的神经元连在一起),Inception将各个分支所生成的特征图按照从左往右将通道加在一起,然后融合输出。其中,每个分支的特征图到紧挨在一起的,这也体现了赫布理论。

    3:文字回答:读完该论文,对你的启发点有哪些?

    1)池化损失空间分辨率,但在定位、检测和人体姿态中仍应用。即定位、检测和人体姿态识别这些任务十分注重空间分辨率信息

    2)增加模型深度和宽度,可有效提升性能,但有两个缺点:容易过拟合,以及计算量过大

    3)为节省内存消耗,先将分辨率降低,再堆叠使用Inception module

    4)最后一个全连接层,是为了更方便的微调,迁移学习

    5)网络中间层特征对于分类也具有判别性

    6)学习率下降策略哦为每8个epochs下降4%(loss曲线很平滑)

    7)数据增强指导方针:尺寸在8%-100%;2.长宽比在[3/4,4/3];3.光照畸变有效

    8)随机采用差值方法可提升性能

    9)实际应用中没必要用144 crops

    4:代码实现:从网上找一张图片,执行GoogLeNet,观察top5输出的类别,并将输出结果截图进行打卡。

     

    img: Golden Retriever from baidu.jpg is: golden retriever
    207 n02099601 狗, golden retriever

     

    5.文字:本篇论文的学习笔记及总结

  • 相关阅读:
    深入.net(文件操作)
    深入.net(多态二)
    Django之form组件
    cookie
    Django进阶
    Django基础
    JQuery
    Dom
    JavaScript
    CSS
  • 原文地址:https://www.cnblogs.com/sariel-sakura/p/13440266.html
Copyright © 2011-2022 走看看