神经网络CNN训练心得--调参经验 - 走看看

zoukankan html css js c++ java

神经网络CNN训练心得--调参经验

1.样本要随机化，防止大数据淹没小数据
2.样本要做归一化。关于归一化的好处请参考：为何需要归一化处理
3.激活函数要视样本输入选择(多层神经网络一般使用relu)
4.mini batch很重要，几百是比较合适的(很大数据量的情况下)
5.学习速率(learning rate)很重要，比如一开始可以lr设置为0.01，然后运行到loss不怎么降的时候，学习速率除以10，接着训练
6.权重初始化，可用高斯分布乘上一个很小的数，这个可以看：权值初始化
7.Adam收敛速度的确要快一些，可结果往往没有sgd + momentum的解好（如果模型比较复杂的话，sgd是比较难训练的，这时候adam的威力就体现出来了）
8.Dropout的放置位置以及大小非常重要
9.early stop，发现val_loss没更新，就尽早停止

另：心得体会
深度学习真是一门实验科学，很多地方解释不了为什么好，为什么不好。
网络层数、卷积核大小、滑动步长，学习速率这些参数的设置大多是通过已有的架构来做一些微调

参考：知乎讨论 https://www.zhihu.com/question/41631631

查看全文

相关阅读:
Android UiAutomator 自动化测试环境搭建---新手1
python -- 计算数学题--用程序解决问题1
linux（ubuntu）遇到的问题 --1
android--email发送邮件，文本还有附件形式的邮件
 fiddler---使用方法1--抓取手机app包
 appium 学习各种小功能总结--功能有《滑动图片、保存截图、验证元素是否存在、》---新手总结（大牛勿喷，新手互相交流）
java 显示视频时间--玩的
 appium获取app应用的package和 activity。---新手总结（大牛勿喷，新手互相交流）
python --appium搭建环境过程 ---新手总结（大牛勿喷，新手互相交流）
centos6下yslow部署

原文地址：https://www.cnblogs.com/dailidong/p/7571094.html

最新文章
CSS外部引入的路径
 python中数据库like模糊查询
 分队
 日报8.19
日报8.18
日报8.17
日报8.15
日报8.14
日报8.13
日报8.12

Copyright © 2011-2022 走看看