zoukankan      html  css  js  c++  java
  • bug记录

    拿来同事的网络直接用,带bn层,人家是forward网络,参数直接use_global_stats: true,我拿过来改也没改直接训,loss曲线长这样,基本降到1.4不动:

     

    更难看的在那个拐点处后面还微微上扬,模型能用,但是没有预期效果。

    修改use_global_stats: false后如下,模型效果完美:

    今天有时间看代码,caffe里的实现:

    所以prototxt里直接写入的参数是个更强的配置,不管是否include{phase:TRAIN},只要设置了batch_norm_param 就会覆盖第14行给的配置。

    batch_norm_param {
        use_global_stats: true
        eps: 0.001
      }

    细节导致的大问题,不管工期多紧张,自己的步调不能乱,任何方法用之前要弄清楚,用过以后要总结。

  • 相关阅读:
    JUC并发工具包之Semaphore
    Linux命令
    uWSGI
    数据库 MySQL 练习
    c++
    c++ 初阶
    Git
    MySQl 和 Redis
    MySQL 查询
    MySQL 命令
  • 原文地址:https://www.cnblogs.com/zhengmeisong/p/9375394.html
Copyright © 2011-2022 走看看