多元线性回归求解过程解析解求解

zoukankan html css js c++ java

多元线性回归求解过程解析解求解
多元线性回归求解过程解析解求解

一、总结

一句话总结：

a、多元线性回归求解过程解析解求解得到的表达式是θ=(X.T*X)^(-1) * (X.T*X)，这样就可以求的ax+b中的a

b、核心代码：theta_best = np.linalg.inv(X_b.T.dot(X_b)).dot(X_b.T).dot(y)
#构建y和x的关系。 np.random.randn(100,1)是构建的符合高斯分布（正态分布）的100行一列的随机数。相当于给每个y增加列一个波动值。 y= 4 + 3 * X + np.random.randn(100,1) #解析解求theta到最优解 theta_best = np.linalg.inv(X_b.T.dot(X_b)).dot(X_b.T).dot(y) print(theta_best) [[3.98485975] [2.86232606]]
1、解析解是什么？

解析解就是指通过公式就可以求得到方程的解。我们只需要方程的参数带入到公式中，计算公式结果就可以得到方程的解，而不用一步一步化简求解。

2、获取机器学习测试数据的方式（生成角度）？

可以生成随机数据：例如 y= 4 + 3 * X + np.random.randn(100,1)

二、多元线性回归求解过程解析解求解

转自或参考：多元线性回归求解过程解析解求解
https://blog.csdn.net/weixin_39445556/article/details/83543945
多元线性回归常用的求解方法有两种：

1-解析解求解法

2-梯度下降法求解

本章我们来看多元线性回归的解析解求解法。

解析解求解法

说到解析解求解，很多同学都已经忘记了什么事解析解。解析解就是指通过公式就可以求得到方程的解。我们只需要方程的参数带入到公式中，计算公式结果就可以得到方程的解，而不用一步一步化简求解。比如我们初中学的一元二次方程的解细节是。是不是豁然开朗，原来就是你小子。

想要用解析解来求解最小二乘函数，那我们首先得知道他的解析解是啥。

a.求得最小二乘公式的解析解。

这里要用到上一章讲到的知识点，求一个函数在某一点上的导数，就是求在这个函数的图像上，过这一点所做切线的斜率。这一点的导函数就是切线的函数。一个二次函数的图像是一个抛物线，那想想一下，通过图像的顶点所做的切线是一条怎样的直线。应该是一条与x轴平行的直线，此时这条直线的斜率为0.函数图像的顶点就是函数的解，也就是说，我们通过函数的解这一点来做切线，切线的斜率就是0.

那我们反过来利用一下刚刚总结出的结论。如果我找到了函数图像上切线为0的点，是不是找到了函数的解？切线是什么？对函数上某一点求导就等于通过这一点在函数图像上做切线，作出的切线就是求导得到的导函数的图像，切线的函数就是对函数求导所得到的导函数，那我们只要找到导函数为0对点，是不是就得到了图像的解？（这一段一定要理解。多读几遍）

所以，我们可以通过对最小二乘函数求导，让导函数为0时的结果，就是最小二乘的解。求导过程如下：

首先对最小二乘进行变形，变为矩阵表达形式：

展开矩阵函数：

展开之后我们对J(θ)求导并令导数等于0：

最终求的解析解为：θ= $(X^{T}X)^{-1}$ $X^{T}Y$

2-解析解的代码实现

手动实现：

import numpy as np import matplotlib.pyplot as plt from bz2 import __author__ #设置随机种子 seed = np.random.seed(100) #构造一个100行1列到矩阵。矩阵数值生成用rand，得到到数字是0-1到均匀分布到小数。 X = 2 * np.random.rand(100,1) #最终得到到是0-2均匀分布到小数组成到100行1列到矩阵。这一步构建列X1(训练集数据) #构建y和x的关系。 np.random.randn(100,1)是构建的符合高斯分布（正态分布）的100行一列的随机数。相当于给每个y增加列一个波动值。 y= 4 + 3 * X + np.random.randn(100,1) #将两个矩阵组合成一个矩阵。得到的X_b是100行2列的矩阵。其中第一列全都是1. X_b = np.c_[np.ones((100,1)),X] #解析解求theta到最优解 theta_best = np.linalg.inv(X_b.T.dot(X_b)).dot(X_b.T).dot(y) # print(theta_best) # 生成两个新的数据点,得到的是两个x1的值 X_new = np.array([[0],[2]]) # 填充x0的值，两个1 X_new_b = np.c_[(np.ones((2,1))),X_new] print (X_new_b) # 用求得的theata和构建的预测点X_new_b相乘，得到yhat y_predice = X_new_b.dot(theta_best) print(y_predice) # 画出预测函数的图像，r-表示为用红色的线 plt.plot(X_new,y_predice,'r-') # 画出已知数据X和掺杂了误差的y，用蓝色的点表示 plt.plot(X,y,'b.') # 建立坐标轴 plt.axis([0,2,0,15,]) plt.show()

利用sklearn包实现

from sklearn.linear_model import LinearRegression import numpy as np import matplotlib.pyplot as plt # 解析解求线性回归 # 手动构建数据集和y与x的对应关系 x = 2 * np.random.rand(100,1) y= 4 + 3*x + np.random.randn(100,1) line_reg = LinearRegression() # 训练数据集,训练完成后，参数会保存在对象line_reg中。 line_reg.fit(x,y) # line_reg.intercept为截距，就是w0，line_reg.coef_为其他参数，coef的全拼为coefficient print(line_reg.intercept_,line_reg.coef_) x_new = np.array([[0],[2]]) # line_reg.predict(x_new) 为预测结果 print(line_reg.predict(x_new)) plt.plot(x_new,line_reg.predict(x_new),'r-') # 画出已知数据X和掺杂了误差的y，用蓝色的点表示 plt.plot(x,y,'b.') # 建立坐标轴 plt.axis([0,2,0,15,]) plt.show()

运行结果如下：

如果有的同学想要运行代码，需要安装pycharm和anaconda，将python的interrupt设置为anaconda的bin目录下的python就可以了。网上有很多教程，请原谅这里不再赘述了。

此处需要说明，因为在使用解析解求解最小二乘的过程中，出现了矩阵求逆的步骤。因为有些矩阵没有逆矩阵，只能使用近似矩阵来代替，所以结果的精度会降低。二则矩阵求逆随着维度的增加，计算量也大大增加，求解速度变慢。所以一般情况下我们都会使用第二种求解办法：梯度下降。
我的旨在学过的东西不再忘记（主要使用艾宾浩斯遗忘曲线算法及其它智能学习复习算法）的偏公益性质的完全免费的编程视频学习网站： fanrenyi.com；有各种前端、后端、算法、大数据、人工智能等课程。

版权申明：欢迎转载，但请注明出处
一些博文中有一些参考内容因时间久远找不到来源了没有注明，如果侵权请联系我删除。

博主25岁，前端后端算法大数据人工智能都有兴趣。

大家有啥都可以加博主联系方式（qq404006308，微信fan404006308）互相交流。工作、生活、心境，可以互相启迪。

聊技术，交朋友，修心境，qq404006308，微信fan404006308

26岁，真心找女朋友，非诚勿扰，微信fan404006308，qq404006308

人工智能群：939687837

作者相关推荐

感悟总结

其它重要感悟总结

感悟总结200813 最近心境200830 最近心境201019 201218-210205
查看全文

相关阅读:
2019自我剖析
 jzoj4640. 【GDOI2017模拟7.15】妖怪
 jzoj4649. 【NOIP2016提高A组模拟7.17】项链
 jzoj3171. 【GDOI2013模拟4】重心
 jzoj4673. 【NOIP2016提高A组模拟7.20】LCS again
学习计算几何基础知识小结
 学习第一类斯特林数小记
 jzoj4213. 对你的爱深不见底
 jzoj4212. 【五校联考1day2】我想大声告诉你
 jzoj3085. 图的计数

原文地址：https://www.cnblogs.com/Renyi-Fan/p/13383455.html

多元线性回归求解过程 解析解求解

多元线性回归求解过程 解析解求解

一、总结

一句话总结：

a、多元线性回归求解过程 解析解求解得到的表达式是θ=(X.T*X)^(-1) * (X.T*X)，这样就可以求的ax+b中的a

b、核心代码：theta_best = np.linalg.inv(X_b.T.dot(X_b)).dot(X_b.T).dot(y)

1、解析解是什么？

解析解就是指通过公式就可以求得到方程的解。我们只需要方程的参数带入到公式中，计算公式结果就可以得到方程的解，而不用一步一步化简求解。

2、获取机器学习测试数据的方式（生成角度）？

可以生成随机数据：例如 y= 4 + 3 * X + np.random.randn(100,1)

二、多元线性回归求解过程 解析解求解

解析解求解法

2-解析解的代码实现

作者相关推荐

多元线性回归求解过程解析解求解

多元线性回归求解过程解析解求解

a、多元线性回归求解过程解析解求解得到的表达式是θ=(X.TX)^(-1) (X.T*X)，这样就可以求的ax+b中的a

二、多元线性回归求解过程解析解求解