FDR校正

zoukankan html css js c++ java

FDR校正

一、假设检验

假设检验的基本思路是：

设立零假设（null hypothesis）H0，以及与零假设H0相对应的非零假设（alternative hypothesis）H1，在假设H0成立的前提下，计算出H0发生的概率，若H0的发生概率很低，基于小概率事件几乎不可能发生，所以可以拒绝零假设。

科学研究一般会把我们希望得到的结论当作非零假设，而期望否定的结论当作零假设。只要我们证明零假设发生的概率很小，我们就有理由拒绝零假设，从而接受非零假设。

例如，我希望得到的结论是早上能够八点起床。那么零假设可以设为：早上八点起不来，如果我计算出来早上八点起不来床的概率非常低，我们就可以接受非零假设：我能够八点起床。

二、假阳性

假阳性：简单打个比喻，就是你本来健健康康的，却被辣鸡医院检测出来你得了病，这就是假阳性。

假阳性率：是对于所有阳性的样本而言，其中是假阳性的有多少。比如，公司体检100个人，检测出来10个人有病，但真正有病的是8个人，那么假阳性率就是0.2。

三、 p值和q值

p值衡量的是原本我们应该接受H0，但实际接受的是H1的概率，它是针对单次统计推断的一个置信度评估。还是之前的例子，如果p=0.05，意味着：能够八点起床这个假设出错的概率为5%。

q值衡量的是在进行多次统计推断后的假阳性率。

四、 FDR校正

之前的例子中，如果我们检验次数多达10000次，那么犯错的概率将500多次。这里虽然犯错的概率没变（5%），但是随着检验次数的增多，我们犯错的次数增多了。因此就需要多重检验校正来减低假阳性的次数。

FDR校正就是为了控制假阳性率。例如，对应于脑网络研究中，假设大脑总共有10000个体素，通过假设检验发现有2000个体素的P<0.05。那么FDR<0.02说的是在2000个激活的体素中，假阳性的体素不超过2000*0.02=40个。

五、如何计算FDR

使用最多的是Benjaminiand Hochberg的方法，简称BH法。
BH 方法首先对p值进行升序排列，对于给定的阈值的，找到最大的k值，使得：q = (p*m)/k <α成立

其中的p为p值，m为检验次数，k为此次检验的p值在所有检验次数中的排名。

假设检验了5次，阈值α=0.05 ，按p值的大小升序排列

p(1) = 0.01 p(2) = 0.015 p(3) = 0.02 p(4) = 0.025 p(5) = 0.03

q(1) = (0.01*5)/1 = 0.05 q(2) = (0.015*5)/2 = 0.0375

q(3) = (0.02*5)/3 = 0.0333 q(4) = (0.025*5)/4 = 0.03125

q(5) = (0.03*5)/5 = 0.03

所以最大的k为3，即认为在FDR<0.05的情况下，1、2、3可以视作为真阳性。对应于脑网络中的那个例子，原本是五个体素都激活，但

经过FDR校正之后，只有3个激活了。

查看全文

相关阅读:
Dapper的常用操作
 git下载慢的解决方案
 笔记
 第06组 Beta冲刺（3/5）
第06组 Beta冲刺（2/5）
第06组 Beta冲刺（1/5）
第06组 Alpha事后诸葛亮
 第06组 Alpha冲刺（6/6）
第06组 Alpha冲刺（5/6）
第06组 Alpha冲刺（4/6）

原文地址：https://www.cnblogs.com/zwrAI/p/13423161.html

一、假设检验

二、假阳性

三、 p值和q值

四、 FDR校正

五、 如何计算FDR

五、如何计算FDR