zoukankan      html  css  js  c++  java
  • sklearn学习笔记之简单线性回归

    简单线性回归

    线性回归是数据挖掘中的基础算法之一,从某种意义上来说,在学习函数的时候已经开始接触线性回归了,只不过那时候并没有涉及到误差项。线性回归的思想其实就是解一组方程,得到回归函数,不过在出现误差项之后,方程的解法就存在了改变,一般使用最小二乘法进行计算。

    使用sklearn.linear_model.LinearRegression进行线性回归

    sklearn对Data Mining的各类算法已经有了较好的封装,基本可以使用fitpredictscore来训练、评价模型,并使用模型进行预测,一个简单的例子如下:

    >>> from sklearn import linear_model
    >>> clf = linear_model.LinearRegression()
    >>> X = [[0,0],[1,1],[2,2]]
    >>> y = [0,1,2]
    >>> clf.fit(X,y)
    >>> print(clf.coef_)
    [ 0.5 0.5]
    >>> print(clf.intercept_)
    1.11022302463e-16

    LinearRegression已经实现了多元线性回归模型,当然,也可以用来计算一元线性模型,通过使用list[list]传递数据就行。下面是LinearRegression的具体说明。

    使用方法

    实例化

    sklearn一直秉承着简洁为美得思想设计着估计器,实例化的方式很简单,使用clf = LinearRegression()就可以完成,但是仍然推荐看一下几个可能会用到的参数:

    • fit_intercept:是否存在截距,默认存在
    • normalize:标准化开关,默认关闭

    还有一些参数感觉不是太有用,就不再说明了,可以去官网文档中查看。

    回归

    其实在上面的例子中已经使用了fit进行回归计算了,使用的方法也是相当的简单。

    • fit(X,y,sample_weight=None)X,y以矩阵的方式传入,而sample_weight则是每条测试数据的权重,同样以array格式传入。
    • predict(X):预测方法,将返回预测值y_pred
    • score(X,y,sample_weight=None):评分函数,将返回一个小于1的得分,可能会小于0

    方程

    LinearRegression将方程分为两个部分存放,coef_存放回归系数,intercept_则存放截距,因此要查看方程,就是查看这两个变量的取值。

    多项式回归

    其实,多项式就是多元回归的一个变种,只不过是原来需要传入的是X向量,而多项式则只要一个x值就行。通过将x扩展为指定阶数的向量,就可以使用LinearRegression进行回归了。sklearn已经提供了扩展的方法——sklearn.preprocessing.PolynomialFeatures。利用这个类可以轻松的将x扩展为X向量,下面是它的使用方法:

    >>> from sklearn.preprocessing import PolynomialFeatures
    >>> X_train = [[1],[2],[3],[4]]
    >>> quadratic_featurizer = PolynomialFeatures(degree=2)
    >>> X_train_quadratic = quadratic_featurizer.fit_transform(X_train)
    >>> print(X_train_quadratic)
    [[ 1  1  1]
     [ 1  2  4]
     [ 1  3  9]
     [ 1  4 16]]

    经过以上处理,就可以使用LinearRegression进行回归计算了。

  • 相关阅读:
    hystrix 源码分析以及属性的配置
    golang官方包限流器使用和原理(golang.org/x/time/rate)
    pip通过指定分支和子目录从git仓库中拉取python包
    cgo使用示例总结
    python装饰器原理和用法总结
    centos7编译安装clang8(同时还会编译llvm的不少东西, 文中附带编译好的二进制压缩包)
    prometheus+alertmanager+granafa监控总结,安装基于docker-compose(长期更新)
    go条件变量的使用和原理
    canal+kafka订阅Mysql binlog将数据异构到elasticsearch(或其他存储方式)
    go对elasticsearch的增删改查
  • 原文地址:https://www.cnblogs.com/liuxingbusi/p/7616548.html
Copyright © 2011-2022 走看看