概念
统计学利用概率论来研究具有随机性的现象。与概率论相反,通常研究对象的分布未知,需要通过样本数据的分析来确定服从什么分布。
-
总体顾名思义就是研究或考察对象的全体
-
总体中的每一个成员称为个体
-
总体中包含的个体数量叫做总体的容量
-
为了研究总体的特性从总体中抽出部分个体进行观察和试验,从总体中抽出的部分个体称为样本
-
统计量是包含了样本信息的函数
-
抽样分布研究统计量的分布,不包含未知参数且尽可能多地概括了样本信息。
常用统计量
-
样本均值 (X)
-
样本方差 (S^2=displaystylefrac 1 {n-1} ...)
-
样本标准差 (S)
-
样本 (k) 阶原点矩 (A_k)
-
样本 (k) 阶中心距 (B_k)
-
定理:(EX=mu, DX=sigma^2),则有 (Eoverline X = mu, Doverline X = sigma^2 /n, ES^2 = sigma^2)
三大抽样分布
-
独立随机变量 (X_{1..n}) 都服从 (N(0,1)),则 (chi^2 = displaystyle sum_{ i = 1 }^{ n } X_i^2) 服从自由度为 (n) 的 (chi^2) 分布。性质:(E(chi^2) = n, D(chi^2) = 2n),可加性
-
设 (Xsim N(0,1), Y sim chi^2(n)) 且相互独立,则 (T=displaystyle frac{X}{ sqrt{frac Y n}}) 服从自由度为 (n) 的 (t) 分布。
-
两个相互独立的 (chi^2) 分布的比称为 (F) 分布,即 (X sim chi^2(n_1),Y sim chi^2(n_2)),则 (F = frac{X/n_1} {Y/n_2}) 服从 (F(n_1,n_2)) 分布。
例:((X,Y,Z)),它们相互独立,分别服从 (N(0,1)),则 (X^2 + Y^2 + Z^2 sim chi^2(3)),(displaystylefrac{X} {sqrt{(Y^2 + Z^2)/2}} sim t(2)),(displaystylefrac{2X^2} {Y^2 + Z^2} sim F(1, 2))
正态总体中的抽样分布
考虑 (Xsim N(mu, sigma^2), X_isim N(mu_i, sigma_i^2)),相互独立
(以下表述为了方便理解记忆,严谨化请自行移项)
-
样本均值分布:(X sim N(mu,displaystylefrac{sigma^2}{n}))
-
样本均值差的分布:(ar{X_1}-ar{X_2} sim N(mu_1-mu_2,displaystylefrac{sigma_1^2}{n_1}+displaystylefrac{sigma_2^2}{n_2}))
-
样本方差的分布:({(n-1)S^2} sim chi^2(n-1){sigma^2})
-
样本方差比的分布:(displaystylefrac{S_x^2}{S_y^2} sim displaystylefrac{sigma_1^2}{sigma_2^2} F(n_1-1,n_2-1))
-
样本 (B_2) 分布:(displaystyle sum_{i=1}^n (X_i-overline X)^2 sim sigma^2 chi^2(n-1))
-
样本均值分布(用 (S)):(displaystyle frac {overline X - mu} {displaystyle frac S {sqrt n}} sim t(n-1))
-
(sigma_1=sigma_2=sigma) 时,均值差的分布(用 (S))(打不动了)