zoukankan      html  css  js  c++  java
  • WEI.X.S

    • 推荐使用 3×3 , 5×5 这样的小卷积核, 卷积步长设为 1. 且搭配 padding, 对卷积核大小为 n×n , 步长为 1 的卷积操作, 当 p=(f−1)/2p = (f-1)/2p=(f1)/2 时, 便可维持输出与原输入等大.
    • 为了硬件字节级存储管理的方便, 卷积核个数通常设置为 2 的整数次幂.
    • 同卷积核大小类似, 池化层的核大小一般也设为较小的值, 如 2×2, 3×3 等. 池化层常起到下采样的作用.
    • 关于 学习率 的设定, 建议模型训练开始时设置 0.01 或 0.001 数量级学习率, 并随网络训练轮数增加逐渐减缓学习率, 另外可通过观察模型训练曲线判断学习率是否合适以及如何调整(增大或减小)学习率.
    • 批规范化 操作可一定程度缓解深层网络训练师的 梯度弥散 效应, 一般讲批规范化操作设置于网络的非线性映射函数之前, 批规范化操作可有效提高模型收敛率.
  • 相关阅读:
    mysql主从原理
    mysql锁和事物隔离
    mysql索引查找原理及调优
    MySQL高级查询
    周总结04
    冲刺第六天
    冲刺第五天
    冲刺第四天
    典型用户模板和用户场景模版
    冲刺第三天
  • 原文地址:https://www.cnblogs.com/larkiisready/p/11681614.html
Copyright © 2011-2022 走看看