zoukankan      html  css  js  c++  java
  • 【cs229-Lecture4】Newton’s method

    之前我们在求Logistic回归时,用的是梯度上升算法,也就是要使得似然函数最大化,利用梯度上升算法,不断的迭代。这节课引出牛顿方法,它的作用和梯度上升算法的一样的,不同的是牛顿方法所需的迭代次数更少,收敛速度更快。

    image红色曲线是利用牛顿法迭代求解,绿色曲线是利用梯度下降法求解。

    牛顿法:wiki

    牛顿法Newton's method)又称为牛顿-拉弗森方法Newton-Raphson method),它是一种在实数域和复数域上近似求解方程的方法。方法使用函数f(x)泰勒级数的前面几项来寻找方程f(x)=0的根。

    NEWTON~1

    首先,选择一个接近函数f(x)零点x_0,计算相应的f(x_0)和切线斜率f'(x_0)(这里f'表示函数f导数)。然后我们计算穿过点(x_0, f(x_0))并且斜率为f'(x_0)的直线和x轴的交点的x坐标,也就是求如下方程的解:

    f(x_0)= (x_0-x)cdot f'(x_0)

    我们将新求得的点的x坐标命名为x_1,通常x_1会比x_0更接近方程f(x)=0的解。因此我们现在可以利用x_1开始下一轮迭代。迭代公式可化简为如下所示:

    x_{n+1} = x_n - frac{f(x_n)}{f'(x_n)}

    已经证明,如果f'连续的,并且待求的零点x是孤立的,那么在零点x周围存在一个区域,只要初始值x_0位于这个邻近区域内,那么牛顿法必定收敛。 并且,如果f'(x)不为0, 那么牛顿法将具有平方收敛的性能. 粗略的说,这意味着每迭代一次,牛顿法结果的有效数字将增加一倍。

    from:http://blog.csdn.net/luoleicn/article/details/6527049

    在上面讨论的是2维情况,高维情况的牛顿迭代公式是:

    其中H是hessian矩阵,定义为:

    高维情况依然可以用牛顿迭代求解,但是问题是Hessian矩阵引入的复杂性,使得牛顿迭代求解的难度大大增加,但是已经有了解决这个问题的办法就是Quasi-Newton methond,不再直接计算hessian矩阵,而是每一步的时候使用梯度向量更新hessian矩阵的近似。







                If you have any questions about this article, welcome to leave a message on the message board.



    Brad(Bowen) Xu
    E-Mail : maxxbw1992@gmail.com


  • 相关阅读:
    数据泵使用笔记与相关shell
    手动创建数据库
    归档日志小试
    SQL语句的结果如何反映在SGA与磁盘中
    oracle 表空间
    linux 循环判断、数组、循环
    oracle 连接方式
    Changing Project Binding to Surround SCM Integration Provider with Visual Studio 2010
    On Caching and Evangelizing SQL
    Windows下使用python3 + selenium实现网页自动填表功能
  • 原文地址:https://www.cnblogs.com/XBWer/p/3964312.html
Copyright © 2011-2022 走看看