Linear Regression(线性回归)（二）—正规方程（normal equations）

zoukankan html css js c++ java

Linear Regression(线性回归)（二）—正规方程（normal equations）

（整理自AndrewNG的课件，转载请注明。整理者：华科小涛@http://www.cnblogs.com/hust-ghtao/）

    在上篇博客中，我们提出了线性回归的概念，给出了一种使代价函数 $J$ 最小的方法：梯度下降法。在本篇博客中，我们给出另一种方法：正规方程。

    $J$ 是关于 $\theta$ 的函数，要求此函数的最小值，有人说可以求导啊，另 ${\nabla _\theta }J(\theta ) = 0$ ，求出相应的 $\theta$ 即可，本文提出的就是此方法。但是由于 $\theta$ 是一个矩阵（向量是特殊的矩阵），我们需要关于矩阵求导方面的知识。

1 矩阵求导

    假设函数 $f:{R^{m \times n}} \to R$ 将 $m \times n$ 阶矩阵映射到实数空间，我们定义 $f$ 对于 $m \times n$ 阶矩阵 $A$ 求导为：

   ，

    所以导函数也是 $m \times n$ 阶的矩阵。例如假设：

，

    而 $f(A) = \frac{3}{2}{A_{11}} + 5{A_{12}}^2 + {A_{21}}{A_{22}}$ ，求 ${\nabla _A}J(\theta )$ :

    另外介绍矩阵迹的概念：对于一个 $n \times n$ 的矩阵 $A$ ，它的迹就是它的对角线的元素求和：

$trA = \sum\limits_{i = 1}^n {{A_{ii}}}$ ，矩阵的迹有如下的性质：



    上述介绍了矩阵函数的求导法则和矩阵迹的概念，下面给出一些后面要用到的结论：

2 正规方程

    大家不用太纠结于基础知识，只是一个推到工具而已，下面才是正题。磨好工具，就去砍柴吧：

    我们的任务是对代价函数求导：即令 ${\nabla _\theta }J(\theta ) = 0$ ，然后解出 $\theta$ 。给定训练集，定义设计矩阵(design matrix) ${X_{m \times n}}$ ，其中 $n$ 是输入特征的维数， $m$ 是训练集中训练样本的个数。将 ${X_{m \times n}}$ 写成下列形式：

    同样，定义目标向量：

，由于 ${h_\theta }({x^{\left( i \right)}}) = {({x^{\left( i \right)}})^T}\theta$ ，于是得到：

    另外对于向量 $z$ ，我们有 ${z^T}z = {\sum\nolimits_i {{z_i}} ^2}$ ，所以：

  由显然： ${\nabla _A}trAB{A^T}C = {B^T}{A^T}{C^T} + B{A^T}C$    （1），

so：

   注意在推导过程中，步骤4我们用到了公式（1），令 ${A^T} = \theta ,B = {B^T} = {X^T}X,C = I$ 。令导函数的值为0，我们得到正规方程：

    解出：

好了，这就是我们要学习的 $\theta$ 。



    总结一下：整篇充斥着公式推导，但思路很简单：欲求代价函数的最小值，令其导函数为0，求出参数即可。最后提点建议，机器学习中是有很多公式推倒的内容，本人认为结论固然重要，但得来的过程也很重要，只有知其然并知其所以然，才能对背后的思想有更深刻的认识。检验自己是否弄懂了公式：看自己能否独立推导出结果。

查看全文

相关阅读:
bzoj 1030 [JSOI2007]文本生成器
 Swift 学习笔记 (闭包)
Swift 学习笔记 (函数)
HTML 学习笔记 JQueryUI（Interactions,Widgets）
HTML 学习笔记 JQuery（表单,表格操作）
HTML 学习笔记 JQuery（animation）
HTML 学习笔记 JQuery（盒子操作）
HTML 学习笔记 JQuery（事件）
HTML 学习笔记 JQuery（DOM 操作3）
HTML 学习笔记 JQuery（DOM 操作2）

原文地址：https://www.cnblogs.com/hust-ghtao/p/3580188.html

Linear Regression(线性回归)（二）—正规方程（normal equations）

（整理自AndrewNG的课件，转载请注明。整理者：华科小涛@http://www.cnblogs.com/hust-ghtao/）

1 矩阵求导

2 正规方程