多项式拟合与线性回归

zoukankan html css js c++ java

多项式拟合与线性回归
https://blog.csdn.net/qq_31852975/article/details/72354578

多项式拟合与线性回归

多项式拟合

设M次多项式为 $f_{M} (x, w) = w_{0} + w_{1} + w_{2} x^{2} + . . . + w_{M} x^{M} = \sum_{j = 0}^{M} w_{j} x^{j}$

当损失函数为 $L (w) = \frac{1}{2} \sum_{i = 1}^{N} (\sum_{j = 0}^{M} w_{j} x^{j} - y_{i})$

时，通过解L(w)最小的问题，可以拟合出该多项式。
这个问题在《统计学习方法》李航的第一章中介绍。不过其中1.18带入后的结果不正确。
具体错误见勘误表http://www.hangli-hl.com/uploads/3/4/4/6/34465961/errata.pdf
具体推导过程http://blog.csdn.net/xiaolewennofollow/article/details/46757657

这里的多项表达式中，f是关于x的一个函数，式中只有一个变量x。

线性回归

线性回归假设特征与结果满足线性关系。这里为什么可以假设为线性关系？为什么可以假设数据是独立同分布的
- 线性关系是用来假定样本集X,Y之间的关系，有了这个关系才可以继续推导出模型的参数向量 $θ^{T}$
- 监督学习假设X，Y满足联合概率分布P(X,Y)。训练数据与测试数据被看做是依联合概率分布独立同分布的。
- 统计学习假定数据存在一定的规律，进而对模型进行学习，但是对于系统具体的定义是未知的。
这里使用Andrew Ng讲义中的公式定义。
对于n个特征的特征向量

$h_{θ} (x) = θ_{0} + θ_{1} x_{1} + θ_{2} x_{2} + . . . + θ_{n} x_{n} = θ^{T} (x)$

$L (w) = \frac{1}{2} \sum_{i = 1}^{N} (\sum_{j = 0}^{M} w_{j} x^{j} - y_{i})$

$J (θ) = \frac{1}{2} \sum_{i = 1}^{M} {(h_{θ} (x^{(i)}) - y^{(i)})}^{2} (假设有 M 个样本, 上标 i 表示第 i 个样本)$

$L (w) = \frac{1}{2} \sum_{i = 1}^{N} (\sum_{j = 0}^{M} w_{j} x^{j} - y_{i})$

梯度下降（ LMS algorithm）

而使得 $J (θ)$

$L (w) = \frac{1}{2} \sum_{i = 1}^{N} (\sum_{j = 0}^{M} w_{j} x^{j} - y_{i})$

求偏导数的反方向。
这里为什么是反方向是梯度下降最小的方向？
- 因为梯度方向为函数增长最快的方向，所以 $J (θ)$
- 的最小值则为减法。
对于每一个特征x，对 $J (θ)$

求偏导。

$\frac{\partial}{\partial θ} J (θ) = (h (θ) (x_{j}) - y) x_{j}$

$L (w) = \frac{1}{2} \sum_{i = 1}^{N} (\sum_{j = 0}^{M} w_{j} x^{j} - y_{i})$

遍历n个样本直至收敛

$θ_{j} := θ_{j} - a (y_{j}^{(i)} - h (θ) x_{j}^{(i)}) x_{j}^{(i)} (对每一个 j)$

$L (w) = \frac{1}{2} \sum_{i = 1}^{N} (\sum_{j = 0}^{M} w_{j} x^{j} - y_{i})$
- $θ^{T}$
每下降一次都需要对所有的样本计算一次。

随机梯度下降（SGD）为每一次遍历只更新 $θ^{T}$

中的一个值，从而减少了遍历的次数，否则每次都需要遍历更新 $θ^{T}$

。除了减少时间复杂度，同时对于流式数据的处理可以实时更新模型。

随机梯度下降的另一种方式是，小批量的更新数据，并不是一次更新一个而是一次更新几个。即几个样本计算一次下降值，对 $θ^{T}$

做下降。

最小二乘法（ Least squares revisited）

通过直接对 $J (θ)$

求导可得最小二乘优化方法。

$θ = (X T X) - 1 X T y$
查看全文

相关阅读:
如何使用php实现首页和子页面之间的交互
 用php实现，打开哪个页面哪个页面就有默认的样式
 后台链接前台有关显示不显示
 上传文件的最大值，post传值的最大值得修改
 linux 操作系统的安装，本地登录及远程登录，vnc连接操作详细步骤
 滑动组件
 Numpy简介
 java对象序列化
 集合类操作需要注意的地方
 TreeMap详解

原文地址：https://www.cnblogs.com/fengff/p/9779551.html

多项式拟合与线性回归

https://blog.csdn.net/qq_31852975/article/details/72354578

多项式拟合与线性回归

多项式拟合

线性回归

梯度下降（ LMS algorithm）

最小二乘法（ Least squares revisited）