最优化算法动量法Momentum - 走看看

zoukankan html css js c++ java

最优化算法动量法Momentum

动量法的结论：

1.动量方法主要是为了解决Hessian矩阵病态条件问题（直观上讲就是梯度高度敏感于参数空间的某些方向）的。

2.加速学习

3.一般将参数设为0.5,0.9，或者0.99，分别表示最大速度2倍，10倍，100倍于SGD的算法。

4.通过速度v，来积累了之间梯度指数级衰减的平均，并且继续沿该方向移动。

算法基本流程：

动量方法直白解释：

如图所示，红色为SGD+Momentum。黑色为SGD。可以看到黑色为典型Hessian矩阵病态的情况，相当于大幅度的徘徊着向最低点前进。
而由于动量积攒了历史的梯度，如点P前一刻的梯度与当前的梯度方向几乎相反。因此原本在P点原本要大幅徘徊的梯度，主要受到前一时刻的影响，而导致在当前时刻的梯度幅度减小。
直观上讲就是，要是当前时刻的梯度与历史时刻梯度方向相似，这种趋势在当前时刻则会加强；要是不同，则当前时刻的梯度方向减弱。

要是当前时刻的梯度与历史时刻梯度方向相似，这种趋势在当前时刻则会加强；要是不同，则当前时刻的梯度方向减弱。

假设每个时刻的梯度g总是类似，那么由我们可以直观的看到每次的步长为：

即当设为0.5,0.9，或者0.99，分别表示最大速度2倍，10倍，100倍于SGD的算法。

查看全文

相关阅读:
转载 linux笔记
 ibatis3.06 + spring 3.06+velocity 整合的VSSI框架测试
 MongoDB的主键类型修改，记录下
 WPF ItemsControl 的 ItemsSource 绑定的一个bug
Android + HTML开发手机应用 demo 代码
 数据库资深工程师期待加盟
 Mapbar POI 转经纬度坐标的各个版本
 MongoDB的GeoSpatial索引之 GeoNear命令，取得距离
 建立可靠性基于Sql server 的网站服务器群的设想
 css3替代图片的尖角圆角效果

原文地址：https://www.cnblogs.com/limingqi/p/12614599.html

Copyright © 2011-2022 走看看