zoukankan      html  css  js  c++  java
  • machine learning (7)---normal equation相对于gradient descent而言求解linear regression问题的另一种方式

    • Normal equation: 一种用来linear regression问题的求解Θ的方法,另一种可以是gradient descent
    • 仅适用于linear regression问题的求解,对其它的问题如classification problem或者feature number太大的情况下(计算量会很大)则不能使用normal equation,而应使用gradient descent来求解。

            (由求导的过程推导而得)

             这种方法是对cost function(J(θ),θ为n+1维向量(θ0,θ1.....θn))对各个θ求偏导,令偏导为0,这样求出对应的θ(高等数学里面求极值的方法),这         样求出的θ,使cost function的值最小

            例如:  

    如何求解θ    

    • 这种求解θ的方法可不进行feature scaling,而对于用gradient descent求解θ而言,feature scaling很重要,它可使收敛速度加快。
    • normal equation与gradient descent两种方法优点与缺点比较

           

    • 当n>10000时,即feature number>10000时,用normal equation消耗太大,这时倾向于使用gradient desccent或者其它算法
    • 当n<1000时,使用normal equation更方便
  • 相关阅读:
    ntp
    mknod
    timeout/timelimit
    Eclipse 包变成文件夹
    Eclipse 包变成文件夹
    Java生成随机字符串和随即生成10以内的字符串
    Java生成随机字符串和随即生成10以内的字符串
    插入排序
    插入排序
    Java 中基本类型和包装类之间的转换
  • 原文地址:https://www.cnblogs.com/yan2015/p/4539265.html
Copyright © 2011-2022 走看看