zoukankan      html  css  js  c++  java
  • 如何计算假设检验的功效(power)和效应量(effect size)?

    做完一个假设检验之后,如果结果具有统计显著性,那么还需要继续计算其效应量,如果结果不具有统计显著性,并且还需要继续进行决策的话,那么需要计算功效。

    功效(power):正确拒绝原假设的概率,记作1-β。

    假设检验的功效受以下三个因素影响:

    • 样本量 (n):其他条件保持不变,样本量越大,功效就越大。
    • 显著性水平 (α): 其他条件保持不变,显著性水平越低,功效就越小。
    • 两总体之间的差异:其他条件保持不变,总体参数的真实值和估计值之间的差异越大,功效就越大。也可以说,效应量(effect size)越大,功效就越大。

    应用:根据显著性水平α,效应量和样本容量n,计算功效。

    (可用G*Power或Statsmodels计算)

    单样本t检验:statsmodels.stats.power.tt_solve_power(effect_size=Nonenobs=Nonealpha=Nonepower=Nonealternative='two-sided')

    独立样本t检验:statsmodels.stats.power.tt_ind_solve_power(effect_size=Nonenobs1=Nonealpha=Nonepower=Noneratio=1.0alternative='two-sided')

    卡方检验:statsmodels.stats.power.GofChisquarePower.solve_power(effect_size=Nonenobs=Nonealpha=Nonepower=Nonen_bins=2)

    F检验:statsmodels.stats.power.FTestPower.solve_power(effect_size=Nonedf_num=Nonedf_denom=Nonenobs=Nonealpha=Nonepower=Nonencc=1)

    方差分析:statsmodels.stats.power.FTestAnovaPower.solve_power(effect_size=Nonenobs=Nonealpha=Nonepower=Nonek_groups=2)

    效应量(effect size): 样本间差异或相关程度的量化指标。

    效应量通常用三种方式来衡量:(1) 标准均差(standardized mean difference),(2) 几率(odd ratio),(3) 相关系数(correlation coefficient)。

    这里说一下第一种:标准均差(standardized mean difference)。主要有以下几种指标:

    Cohen’s : 两总体均值之间的标准差异。适用于两组样本的样本量和方差相似的情况。

    计算公式:cohen's d effect size

    其中:cohen's d calculation

    Hedges’ g是cohen的方法的改进,适用于两组样本的样本量不同的情况。

    计算公式:hedges' g method of effect size

    其中:standard deviation

    Glass’s Δ (delta)和cohen的方法类似,但是只除以控制组的标准差。适用于两组样本的方差不同的情况。

    计算公式:glass' A method of effect size

    Cramer’s φ (Phi) or Cramer’s V用于测算类别型数据的效应量。当类别型变量包含2个类别时,使用Cramer’s phi,如果超过2个类别,那么使用Cramer’s V。

    Cohen’s f2: 用于测算方差分析,多元回归之类的效应量。

    计算公式:cohen's f2 method of effect size

    应用:根据显著性水平α,功效和样本容量n,计算效应量。

    (可用G*Power或Statsmodels计算)

    单样本t检验:statsmodels.stats.power.tt_solve_power(effect_size=Nonenobs=Nonealpha=Nonepower=Nonealternative='two-sided')

    独立样本t检验:statsmodels.stats.power.tt_ind_solve_power(effect_size=Nonenobs1=Nonealpha=Nonepower=Noneratio=1.0alternative='two-sided')

    卡方检验:statsmodels.stats.power.GofChisquarePower.solve_power(effect_size=Nonenobs=Nonealpha=Nonepower=Nonen_bins=2)

    F方差齐性检验:statsmodels.stats.power.FTestPower.solve_power(effect_size=Nonedf_num=Nonedf_denom=Nonenobs=Nonealpha=Nonepower=Nonencc=1)

    方差分析:statsmodels.stats.power.FTestAnovaPower.solve_power(effect_size=Nonenobs=Nonealpha=Nonepower=Nonek_groups=2)

    以上两种应用都属于事后检验(post hoc)。除此之外,还有一个应用就是:根据显著性水平α,功效和效应量,计算样本容量n。这属于事前检验(prior)。具体请见:《如何确定假设检验的样本量?》

    参考:

    https://wenku.baidu.com/view/d78a82ecb9d528ea80c7792c.html

    https://www.statisticssolutions.com/statistical-analyses-effect-size/

  • 相关阅读:
    LC.225. Implement Stack using Queues(using two queues)
    LC.232. Implement Queue using Stacks(use two stacks)
    sort numbers with two stacks(many duplicates)
    LC.154. Find Minimum in Rotated Sorted Array II
    LC.81. Search in Rotated Sorted Array II
    LC.35.Search Insert Position
    前后端分离:(一)
    Redis基本使用(一)
    GIT篇章(二)
    GIT篇章(一)
  • 原文地址:https://www.cnblogs.com/HuZihu/p/12009535.html
Copyright © 2011-2022 走看看