zoukankan      html  css  js  c++  java
  • 【数据分析师 Level 1 】5.方差分析

    1.方差分析

    方差分析可以提高假设检验的效率,增加了分析的可靠性

    方差分析的基本原理

    指根据试验结果,鉴别各个有关因素对试验结果影响的有效方法。是方差的可加性原则

    方差分析的基本假设

    • 各个总体都应服从正态分布
    • 各个总体的方差都必须相同
    • 观察值是独立的

    单因素方差分析

    指将所获得的数据按某些项目分类后,再分析各组数据之间有无差异的方法,其本质是检验多个总体均值是否相等,其计算过程可以理解为是变异分解过程。

    单因素反差分析的基本步骤

    • 提出假设,

    •  各个平均值相等,即自变量对因变量没有显著影响

    • 构造检验统计量(F统计量)

    • 统计决策(根据P值)

    2.计算F统计量

    第一步:变异分解

    为了构造检验统计量,在方差分析中,需要计算三个误差平方和(总体平方和、组间平方和、组内平方和)

    • 总体平方和

    • 组间平方和

    • 组内平方和

    SSA是对于随机误差和系统误差大小的度量,反映的是自变量对于因变量的影响,也叫做自变量效应

    SSE是对于随机误差大小的度量,反映的是除自变量和因变量影响之外的,其他因素对因变量的总的影响,称做残差效应

    SST是总平方和,是对于全部误差程度的影响,反映的是自变量和残差变量的共同影响,等于SSA+SSE

    计算均方

    • 组间均方

    • SSA的自由度为k−1

    • 组内均差

    • SSE的自由度为n−k

    3.计算检验统计量F

    4.统计决策

    将统计量的值F与给定的显著性水平α的临界值Fα进行比较(或者用P值与α比较),做出原假设 H 0 的决策

    例题精讲

    1.下列方差分析以下说法不正确的是?

    A.方差分析同时检验多组均值是否存在差异的问题

    B.方差分析同时检验两组均值是否存在差异的问题

    C.方差分析不能同时检验两组均值是否存在差异的问题

    答案:C

    解析:这里的主要干扰项是方差分析能不能处理两组均值的差异问题,其实是可以的,例如检验条件满足的前提下,t方和F检验的显著性是等价的

    2.有关方差分析不正确的是?

    A.方差分析可以对若干组均值是否相等同时进行检验

    B.方差分析要求各组内的样本为小样本

    C.正态分布是方差分析的前提条件

    D.方差的可加性表述为离差平方和等于组内方差与组间方差之和

    答案:B

    解析:A项说的就是F检验,B项“方差分析要求各组内的样本为小样本”,这并不是方差分析的条件,C项是前提条件,D项是方差分析的基本原理

    3.方差不满足齐性检验,以下不正确的是()

    A.不同组均值隐含的信息不同,需要修正

    B.正态分布的前提条件无法满足

    C.影响不同组均值的计算

    D.数据分析结果无法推理到总体

    答案:BC

    解析:A项方差大小意味着均值隐含信息的多少,是对的;D项中“数据分析结果无法推理到总体”,指的是对p值得影响,B项,因为即使方差不齐也可能是满足正态分布的,C项是由一组数据计算而来的,与方差齐性显然没有关系

  • 相关阅读:
    Java之多线程(实现Runnable接口)
    Java之使用HttpClient发送GET请求
    hbase中文内容编码转换
    Java之utf8中文编码转换
    Java之正则表达式
    Java之List排序功能举例
    maven测试时中文乱码问题解决方法
    Hbase之IP变更后无法启动问题解决
    Hbase远程连接:Can't get the locations
    重启Hbase命令
  • 原文地址:https://www.cnblogs.com/pandaboy1123/p/14021078.html
Copyright © 2011-2022 走看看