zoukankan      html  css  js  c++  java
  • 数据产品-数据分析-统计模型分析-回归分析

    当掌握了大量数据时候,我们往往希望在数据中挖掘更多的信息,一般可以应用成熟模型进行比较深入的分析。

    举几个例子:

    ①例如我们工作中常用的,预估下今年12月份的销量情况

    预估销量情况这时候我们可以用回归分析,可以理解为一个自变量或者多个自变量通过算法运算得出因变量,例如预估12月份的销量,因变量是销量。与他相关的有商品类型,商品种类,是否有优惠券或者优惠,等等....根据历史数据通过回归分析拟合成一个函数,这样就可以根据自变量推算出未来的因变量数值。

    这里推荐一款比较常用的数据分析软件:SPSS,里面自带一些分析函数,当然也可以使用R语言 或者 EX或者其他一些分析工具,自己用得习惯就好。

    假设现在我抽取数据库中的下列一组数据进行12月份的回归分析:

    1.首先我们获取到如下数据

    我们现在需要通过回归分析来了解商品上架种类和商品销售量之间是否有关系,如果有的话又是怎么样的一种关系,并且是否可以通过目前的数据来预测一下12月份的商品销售量情况。然后我们把上面的数据导入SPSS工具。

    当我们输入完目标数据以后在变量视图中就会出现三行数据,每一行数据从上到下是同我们三列数据一一对应的,我们进行稍微的调整以后就可以开始我们的分析了。

    如上图所示,我们需要从分析的工具栏当中选择回归,然后选择线性(回归的模型选择有很多种,我们选择线性回归)。选择完了以后我们就能够进入到下面这个界面:

    我们把商品销售量设为因变量,自变量为商品上架种类数,然后点击右侧的统计量选项:

    在统计量里面我们需要选择D-W检验,这个检验是残差检验,查看回归模型是否有问题。

    在绘制项中我们选择输出残差直方图与正态概率图,通过这个图来大致确定数据是否存在自相关等情况。当我们点击确定以后我们就能够从输出界面看到我们本次分析的结果:

    从上面结果图中我们可以看出,不管是R方还是调整后的R方都是在90%以上,说明本次回归模型的拟合效果是很好的。

    从第二个方差分析结果图,我们可以看出方差分析的显著性为0.00<0.05,说明在本次分析中上架商品种类数和商品销量之间存在显著的线性关系。

    从第三个系数图中,我们能看到整个回归分析的结果是很好的,t检验里的显著性水平0.00<0.05,说明本次回归方程的系数是显著的,具有统计学意义。本次回归分析的回归方程为:

    Y=399.954+7.503X




  • 相关阅读:
    包和模块的导入问题
    第9.6节 Python使用read函数读取文件内容
    第9.5节 Python的readlines读取文件内容及其参数hint使用分析
    第9.4节 Python中用readline读取二进制文件方式打开文件
    第9.3节 Python的文件行读取:readline
    第9.2节 Python的文件打开函数open详解
    第9.1节 Python的文件打开函数open简介
    第九章 Python文件操作
    第8.34节 《Python类中常用的特殊变量和方法》总结
    第8.33节 Python中__getattr__以及__getattr__与__ getattribute__的关系深入剖析
  • 原文地址:https://www.cnblogs.com/codewan/p/11189361.html
Copyright © 2011-2022 走看看