zoukankan      html  css  js  c++  java
  • 再谈假设检验(比率检验)

    《假设检验(Hypothesis Testing)》一文中,我们罗列了关于比较均值或方差的几种假设检验类型。除此之外,还有一种经常用到的检验类型,那就是比较比率(proportion)的假设检验。比如说,使用A方案的付费转化率为30%,使用B方案的付费转化率为34%,请问这两个转化率之间是否有显著不同?

    总体比率是指总体中具体某种相同特征的个体所占的比值。通常用π表示总体比率,用p表示样本比率。比如某样本转化率为p的话,那么没有转化的人群比率就是1-p。这属于二项分布,当样本量足够大的时候,二项分布可以转换为正态分布。

    比率类的假设检验有两种应用场景:比较样本比率和总体比率是否相同,比较两样本比率是否相同。

    1,比较样本比率和总体比率是否相同,以此来检验样本和总体之间的差异(单样本比率检验):

    当np≥5以及n(1-p)≥5时(大样本的情况下),p的抽样分布近似正态分布。因此,检验统计量可以选用z值:

    原假设:     H0: π≥π0        H0: π≤π0        H0: π=π0  (样本和总体比率)

    备择假设: Ha: π<π0        Ha: π>π0        Ha: π≠π0  (样本和总体比率)

                         (左尾)      (右尾)      (双尾)

    拒绝法则(临界值法):如果z ≤ -zα,则拒绝原假设(左尾)

                                           如果z ≥ zα,则拒绝原假设(右尾)

                                           如果z ≤ -zα/2 或 z ≥ zα/2,则拒绝原假设(双尾)

    拒绝法则(p值法):如果p值≤α,则拒绝原假设

    2,比较两样本比率是否相同,以此来检验两总体之间的差异(两独立样本比率检验):

    当np1≥5,np2≥5以及n(1-p1)≥5,n(1-p2)≥5时(大样本的情况下),p1-p2差值的抽样分布近似正态分布。因此,检验统计量可以选用z值:

    由于π1和π2未知(这不是废话嘛,要是已知的话直接就能知道这两个总体比率是否相同了),那么就需要用样本比率来对总体比率进行估计,这里分为两种情况:

    一种情况是原假设π12=D0(D0=0)为真,也就是两总体比率相同,那么就可以统一用p()来估计总体比率,检验统计量就可以写成:

    另一种情况是原假设π12=D0(D0≠0)为真,也就是两总体比率不同,分别用p1和p2来估计两总体的比率,检验统计量就可以写成:

    原假设:     H0: π1≥π2        H0: π1≤π2        H0: π12  (样本和总体比率)

    备择假设: Ha: π12        Ha: π12        Ha: π1≠π2  (样本和总体比率)

                         (左尾)       (右尾)         (双尾)

    拒绝法则(临界值法):如果z ≤ -zα,则拒绝原假设(左尾)

                                           如果z ≥ zα,则拒绝原假设(右尾)

                                           如果z ≤ -zα/2 或 z ≥ zα/2,则拒绝原假设(双尾)

    拒绝法则(p值法):如果p值≤α,则拒绝原假设

    可以用G*Power或statsmodels进行比率假设检验:

    statsmodels:statsmodels.stats.proportion.proportions_ztest(countnobsvalue=Nonealternative='two-sided'prop_var=False

    返回:z统计量的具体值和p值。

    计算效应量:

    公式:2 * (arcsin(sqrt(p1)) - arcsin(sqrt(p2)))  (cohen's h)

    statsmodels:statsmodels.stats.proportion.proportion_effectsize(prop1prop2method='normal')   (两总体比率)

    计算样本量&功效:

    statsmodels:statsmodels.stats.power.zt_ind_solve_power(effect_size=Nonenobs1=Nonealpha=Nonepower=Noneratio=1.0alternative='two-sided')

    附:

    比率类的假设检验,其最小样本量的计算公式为:(摘自:https://jeffshow.com/caculate-abtest-required-sample-size.html

    p1我们称为基础值,是实验关注的关键指标现在的数值(对照组);p2我们称为目标值,是希望通过实验将其改善至的水平;通常设定α为0.05,β为0.2 

  • 相关阅读:
    mysql删除重复记录语句的方法
    超详细mysql left join,right join,inner join用法分析
    CGLib动态代理原理及实现
    mysql开启慢查询日志及查询windows
    数据库事务隔离级别及脏读、幻读、不可重复读及传播行为
    java的动态代理机制详解
    MySQL常见面试题
    2019年的冬季,蒟蒻的PKUWC游记(12.20~12.23)
    初学生成函数(一)——普通生成函数
    转:基于jquery点击切换样式并且可以记忆cookie
  • 原文地址:https://www.cnblogs.com/HuZihu/p/12015669.html
Copyright © 2011-2022 走看看