梯度下降法 - 走看看

zoukankan html css js c++ java

梯度下降法

　　从wiki上面摘录下来

http://zh.wikipedia.org/wiki/%E6%A2%AF%E5%BA%A6%E4%B8%8B%E9%99%8D%E6%B3%95

　　这个方法的作用是, 通过迭代, 迅速取得 $F(\mathbf{x})$ 的最小值所在的坐标, 这样就可以作为一些惩罚函数的优化方法

　　梯度下降法，基于这样的观察：如果实值函数 $F(\mathbf{x})$ 在点 $\mathbf{a}$ 处可微且有定义，那么函数 $F(\mathbf{x})$ 在 $\mathbf{a}$ 点沿着梯度相反的方向 $-\nabla F(\mathbf{a})$ 下降最快。

因而，如果

$\mathbf{b}=\mathbf{a}-\gamma\nabla F(\mathbf{a})$

对于 $\gamma>0$ 为一个够小数值时成立，那么 $F(\mathbf{a})\geq F(\mathbf{b})$ 。

考虑到这一点，我们可以从函数 $F$ 的局部极小值的初始估计 $\mathbf{x}_0$ 出发，并考虑如下序列 $\mathbf{x}_0, \mathbf{x}_1, \mathbf{x}_2, \dots$ 使得

$\mathbf{x}_{n+1}=\mathbf{x}_n-\gamma_n \nabla F(\mathbf{x}_n),\ n \ge 0.$

因此可得到

$F(\mathbf{x}_0)\ge F(\mathbf{x}_1)\ge F(\mathbf{x}_2)\ge \cdots,$

如果顺利的话序列 $(\mathbf{x}_n)$ 收敛到期望的极值。注意每次迭代步长 $\gamma$ 可以改变。

下侧的图片示例了这一过程，这里假设 $F$ 定义在平面上，并且函数图像是一个碗形。蓝色的曲线是等高线(水平集)，即函数 $F$ 为常数的集合构成的曲线。红色的箭头指向该点梯度的反方向。（一点处的梯度方向与通过该点的等高线垂直）。沿着梯度下降方向，将最终到达碗底，即函数 $F$ 值最小的点。

　　之所以学到这个算法, 是因为模式识别中的感知器算法, 应用了这个方法去获得最快收敛到最小值的惩罚函数

查看全文

相关阅读:
为什么叫"鲁棒"图
 Linux系统信息查看命令......
網頁配色工具
 java基础方面知识点
 網頁設計收藏站70個
 bj_linux...
工具
 软件工程阅读(中英文对照)之软件维护
 软件工程新方法和技术简介(英文)
软件工程阅读(中英文对照)之文档技术

原文地址：https://www.cnblogs.com/moondark/p/2723285.html