zoukankan      html  css  js  c++  java
  • 5 线性回归算法

    1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性

     

     回归问题的判定:

    回归和分类的区别:

    应用:房价预测、销售额预测、贷款额度的预测等。

    单因素影响的一元线性模型例子:房价预测。

    横坐标为房子面积,纵坐标为价格。

     

    线性回归的定义:通过一个或多个自变量与因变量之间进行建模的回归方法,其中一个可以为一个或者多个自变量之间的线性组合。

    数组(numpy:ndarray)分为:加汰,乘汰。

    0维  1, 2, 3

    1维  [ 1, 2, 3 ]

    2维  [ [ 1, 2, 3 ], [1 ,2 ,3 ] ]

    3维  [ [ [ 1, 2, 3 ], [1, 2, 3 ] ],

              [ [ 1, 2, 3 ], [1, 2, 3 ] ] ]

    矩阵

    (1)矩阵必须是2维的。

    (2)矩阵满足了特殊的运算要求:

    矩阵的乘法:(m行,h列)*(h行,n列)=(m,n)

    c是a和b的数组乘积,结果是3行4列

    d是a和b的矩阵乘积,结果是3行1列

    30 = 1*1+2*2+3*3+4*4

         = 1+4+9+16

    70 = 1*5+2*6+3*7+4*8

         = 5+12+21+32

    110 = 1*9+2*10+3*11+4*12

           =9+20+33+48

    满足线性回归的要求。

    y =w*x+b(w权重,x为特征--房子面积)

    机器预测值和真实值也是存在一定误差的。

    有误差需要迭代算法减小误差。

     

     

     

     

     代码实现梯度下降例子:

     1 import matplotlib.pyplot as plt
     2 import random
     3 
     4 _xs = [0.1*x for x in range(0, 10)]
     5 _ys = [12*i+4 for i in _xs]
     6 print(_xs)
     7 print(_ys)
     8 
     9 w = random.random()   # 权重
    10 b = random.random()   # 间距
    11 a1 = []
    12 b1 = []
    13 for i in range(100):       # 训练次数
    14     for x, y in zip(_xs, _ys):  # 让分别遍历上面的数据
    15         o = w*x+b          # o代表预测值
    16         e = (o-y)          # 误差  预测值减去标签 有+-
    17         loss = e**2        # 误差平方等于损失
    18         dw = 2*e*x         # 对w求导
    19         db = 2*e*1         # 对b求导
    20         w = w - 0.1*dw     # 梯度下降
    21         b = b - 0.1*db     # 学习率为0.1
    22         print('loss={0},w={1},b={2}'.format(loss, w, b))
    23     a1.append(i)
    24     b1.append(loss)
    25     plt.plot(a1, b1)
    26     plt.pause(0.1)
    27 plt.show()

    数据:

    10次

    50次

    100次

    10次                                                                      50次                                                                 

    100次

    迭代算法减少损失,减小误差。

    线性回归可以找到规律,预测趋势,或者说是对数据找一个合适的表达式来表达某一个趋势。对于我们的生活,在预测房价,预测投资风险,预测空气质量等多领域有重要的意义。

    2.思考线性回归算法可以用来做什么?(大家尽量不要写重复)

     预测身高体重,预测空气质量,预测投资风险,预测票房,预测产品销售量等。

    3.自主编写线性回归算法 ,数据可以自己造,或者从网上获取。(加分题)

    算出女大学生根据身高猜测体重的函数y=0.72*x+(-67.68)。

    若以此为标准,猜测身高为155或165女大学生的体重为:

  • 相关阅读:
    leetcode 39 Combination Sum
    C/C++ 单元测试 catch
    二叉树
    线性表
    POJ1002
    HDU4329
    hdu 4329
    java代码优化总结1
    Linux操作系统常用命令总结1
    java开发基础知识总结1
  • 原文地址:https://www.cnblogs.com/linyanli/p/12737906.html
Copyright © 2011-2022 走看看