统计假设检验

zoukankan html css js c++ java

统计假设检验

统计假设检验可分为参数假设检验和非参数假设检验两大部分。

当总体分布形式已知，检验的目的是对总体的参数及其性质作出判断，则称这种检验为参数假设检验。

若总体分布形式未知，需对总体分布函数形式或总体之间的关系进行推断，则称为非参数假设检验。

显著性检验：先提出假设，然后作出否定或者不否定的判断，称为显著性检验。

一、检验法则

有两个对立的假设，其中(H_0)称为原假设（零假设）;(H_1)称为备择假设（对立假设）。

要检验总体均值(mu)，实际上可转化为检验样本均值(overline{X})，因为(overline{X})的观察值(overline{x})的大小在一定程度上反映了的(mu)大小。如果(H_0)成立，则(mid overline{x}-mu_0 mid)一般不应太大，如果(mid overline{x}-mu_0 mid)过分大，则可怀疑(H_0)的正确性从而拒绝(H_0)，反之则接受(H_0)。

又考虑到当(H_0)成立时，统计量 $frac{mid overline{x}-mu_0 mid}{sigma /sqrt{n}} $ ~ $ N(0,1)$，这样衡量 (mid overline{x} - mu_0 mid) 的大小就可等价地归结为衡量 $frac{mid overline{x}-mu_0 mid}{sigma /sqrt{n}} $ 的大小，由此我们可选定一正数(k)，使得当(frac{mid overline{x}-mu_0 mid}{sigma /sqrt{n}} geq k)时，就拒绝(H_0)，当(frac{mid overline{x}-mu_0 mid}{sigma /sqrt{n}} < k)时，就接受(H_0)。

由于(frac{mid overline{x}-mu_0 mid}{sigma /sqrt{n}} ) ~ $ N(0,1)$，根据标准正态分布分位点定义可得：

[P lbrace frac{mid overline{x} - mu_0 mid}{sigma / sqrt{n}} geq k mid H_0为真 brace = P lbrace frac{mid overline{x} - mu_0 mid}{sigma / sqrt{n}} geq u_{1-frac{alpha}{2}} mid H_0为真 brace = alpha ]
这样，我们就得到如下检验法则：

若(frac{mid overline{x} - mu_0 mid}{sigma / sqrt{n}} geq u_{1-frac{alpha}{2}})，则拒绝(H_0)；

若(frac{mid overline{x} - mu_0 mid}{sigma / sqrt{n}} < u_{1-frac{alpha}{2}})，则接受(H_0)。

于是，$frac{mid overline{x}-mu_0 mid}{sigma /sqrt{n}} $就成了检验统计量。

当然，这只是讨论了正态总体参数的假设检验问题，对于其他假设检验，虽然检验统计量不同，但其检验法则、基本思路一样。

二、两类错误

（一）第I类错误

当(H_0)为真时，我们却作出了拒绝(H_0)的判断，这个时候我们就犯了第I类错误，又称为“弃真”。即在原假设成立的情况下拒绝了原假设，从而把正确的内容当作错误的内容抛弃了。

犯第I类错误的概率为：(P lbrace 拒绝H_0 mid H_0为真 brace = alpha)

这里，(alpha)为显著性水平。

（二）第II类错误

当(H_0)不成立时，却接受(H_0)了，我们称这类错误为第II类错误，又称为“取伪”。

犯第II类错误的概率为：(P lbrace 接受H_0 mid H_0为假 brace = eta)

现实中(alpha)、(beta)的值不可能同时小，也就是说，在样本容量给定的情况下，如果减少犯第I类错误的概率，就可能增加犯第II类错误的概率。由于第I类错误相对于第II类错误导致的后果更为严重，因此现实中的做法通常是对犯第I类错误的概率加以控制，然后再适当考虑犯第II类错误的概率。

我们把这种只对犯第I类错误的概率加以控制，而不考虑犯第II类错误的检验问题，称为显著性检验问题。

三、基本方法

参数假设检验通常采用(mu)检验法、(t)检验法、(F)检验法、(chi^2)检验法等；

非参数假设检验通常采用皮尔逊拟合检验、魏氏检验、麦氏检验法。

（一）参数假设检验法

参数假设检验法具体包括正态总体参数检验和非正态总体参数检验。

1、正态总体参数检验

对于正态总体，其参数无非是两个：(mu)和(sigma^2)。如果加上两个正态总体的参数一块比较，也只有四种情形：①关于(mu)的检验；②关于(sigma^2)的检验；③关于(mu_1-mu_2)的检验；④关于(frac{sigma_1^2}{sigma_2^2})的检验。

（1）(mu)检验

(mu)检验适用于在方差已知的情况下，对期望值(mu)的检验（包括单总体和多总体）。

a.在单个正态总体情况下，适用检验统计量：

(mu = frac{mid overline{x}-mu_0 mid}{sigma /sqrt{n}})~(N(0,1))

b.在两个正态总体情况下，设(x_1,x_2,ldots,x_{n_1}),为出自(N(mu_1,sigma_1^2))的样本，(y_1,y_2,ldots,y_{n_2})为出自(N(mu_2,sigma_2^2))的样本，(sigma_1^2,sigma_2^2)已知，且样本之间相互独立。则适用统计量为：

(mu = frac{overline{x} - overline{y}}{sqrt{frac{sigma_1^2}{n_1} + frac{sigma_2^2}{n_2}}}) ~ (N(0,1))

另外，对总体百分数的检验一般也采用检验法进行，其适用统计量为：

[mu = frac{p_x-p_{mu}}{sqrt{frac{p_{mu}(1-p_{mu})}{n}}} ]
其中，(p_x)为样本百分数，(p_{mu})为总体百分数。

（2）(t)检验

(t)检验适用于当方差未知时对期望值(mu)的检验。总体可以是单总体，也可以是双总体。但如果是双总体，它们之间的样本必须是独立的。

a.对于单总体，适用检验统计量为：
(t= frac{overline{x} - mu_0}{frac{s}{sqrt{n}}})~(t(n-1))
b.对于双总体，可分为两种情况进行讨论。

第一种情况是，(sigma_1^2,sigma_2^2)未知，但(sigma_1^2=sigma_2^2=sigma^2)。此时可选择检验统计量：
(t= frac{overline{x} -overline{y}}{s_{omega} cdot sqrt{frac{1}{n_1}+frac{1}{n_2}}})~(t(n_1+n_2-2))

第二种情况是，(sigma_1^2,sigma_2^2)未知，但(n_1=n_2=n)。此时可考虑采用配对检验法，具体方法如下：

令：(d_i=x_i-y_i(i=1,2,ldots,n))，并假定(d_1,d_2,ldots,d_n)分别是来自正态总体(N(mu_d,sigma^2))的样本。(mu_d,sigma^2)均未知，(overline{d})与(s^2)分别是(d_1,d_2,ldots,d_n)的样本均值和样本方差。若进行双边检验，可令(H_0:mu_d=0,H_1:mu_d eq 0)。

此时可选择(t= frac{overline{d}-0}{frac{s}{sqrt{n}}})~(t_{1-frac{alpha}{2}}(n-1))作为检验统计量，其拒绝域为：

[c_1= lbrace t mid mid t mid geq t_{1-alpha}(n-1) brace ]
（3）(chi^2)检验

(chi^2)检验主要用于对方差(sigma^2)的检验，且适用于单参数情形。

a.(mu)未知

设(x_1,x_2,ldots,x_n)为(N(mu,sigma^2))的一个样本，考虑假设：
①(H_0:sigma^2 = sigma_0^2, H_1:sigma^2 eq sigma_0^2)
②(H_0:sigma^2 leq sigma_0^2, H_1:sigma^2 > sigma_0^2)
适用检验统计量为：
(chi^2 = frac{(n-1)s^2}{sigma_0^2})~(chi^2(n-1))

b.(mu)已知

适用于检验统计量为：

(chi^2 = frac{sum_{i=1}^n (x_i-mu_0)^2}{sigma_0^2})~(chi^2(n))

(4)(F)检验

(F)检验也是用于对方差的检验，不同的是，(F)检验往往用于两参数情形。

设(x_1,x_2,ldots,x_{n_1})和(y_1,y_2,ldots,y_{n_2})分别为出自(N(mu_1,sigma_1^2))和(N(mu_2,sigma_2^2))的样本，且样本之间独立。考虑假设：
①(H_0:sigma_1^2=sigma_2^2, H_1:sigma_1^2 eq sigma_2^2)
②(H_0:sigma_1^2 leq sigma_2^2, H_1: sigma_1^2 > sigma_2^2)

适用检验统计量为：
(F=frac{s_1^2}{s_2^2})~(F(n_1-1,n_2-1))

2、非正态总体参数检验

非正态总体的抽样分布不易求出，求检验统计量及其分布就很困难了，因此除一些特殊例子外，非正态总体参数的假设检验常采用大样本方法。大样本一般要求(n geq 30)，最好(n geq 50)。

设(x_1,x_2,ldots,x_n)是总体(X)的样本，(X)~(N(mu,sigma^2 ))，(n)足够大。要检验的假设有：

（1）(H_0:mu=mu_0, H_1:mu eq mu_0)

（2）(H_0:mu geq mu_0, H_1:mu < mu_0)

（3）(H_0:mu leq mu_0, H_1:mu > mu_0)

由于(X)不是正态分布，故求出其检验统计量及其分布比较困难，但当(n)足够大且(H_0)成立时，根据中心极限定理，有：
(mu = frac{overline{x} - mu_0}{frac{sigma}{sqrt{n}}})~(N(0,1))

在具体选择检验统计量时，可分两种情况讨论：

（1）当(sigma^2)已知时，可选择检验统计量：

(mu = frac{overline{x} - mu_0}{frac{sigma}{sqrt{n}}})~(N(0,1))

（2）当(sigma^2)未知时，可选择检验统计量：

(mu = frac{overline{x} - mu_0}{frac{s}{sqrt{n}}})~(N(0,1))

（二）非参数检验法

1、皮尔逊(chi^2)拟合检验法

2、魏氏（Wilcoxon）检验

3、麦氏（McNehmar）检验

参考文献：
[1] 《统计学》第二版. 2010. 游士兵

查看全文

相关阅读:
hdu 5965 扫雷
 51nod 1441 士兵的数字游戏（素数处理
 51nod 1453抽彩球
 51nod 1255 字典序最小的子序列
 codeforces 948A
Splay 伸展树 bzoj3224 bzoj3223
2016-2017 ACM-ICPC, NEERC, Northern Subregional Contest C（gym/101142 C）
2016-2017 ACM-ICPC, NEERC, Northern Subregional Contest F（gym/101142 F）
2016-2017 ACM-ICPC, NEERC, Northern Subregional Contest G（gym/101142 G）
Educational Codeforces Round 32 E 巨型背包

原文地址：https://www.cnblogs.com/IvyWong/p/10024136.html

统计假设检验

一、检验法则

二、两类错误

（一）第I类错误

（二）第II类错误

三、基本方法

（一）参数假设检验法

1、正态总体参数检验

（1）(mu)检验

（2）(t)检验

（3）(chi^2)检验

(4)(F)检验

2、非正态总体参数检验

（二）非参数检验法

1、皮尔逊(chi^2)拟合检验法

2、魏氏（Wilcoxon）检验

3、麦氏（McNehmar）检验