样本均值与样本方差
样本均值:$overline{X}=frac{sum_{i=1}^k X_i}{k}$
样本方差:$Var(X)=frac{sum_{i=1}^k |X_i-overline{X}|}{k}$
正态分布
$f(x|mu,sigma^2)=frac{1}{(2pi)^1/2}exp[-frac{1}{2}(frac{x-mu}{sigma})^2]$ , $mu$为均值,$sigma$为标准差,$mu$决定了中心轴的位置,$sigma$决定了函数的高度。
标准正态函数:
$f(x|0,1)=frac{1}{(2pi)^1/2}exp(-frac{1}{2}x^2)$
伽马分布
首先说说伽马分布的由来,伽马分布是基于著名的伽马函数推导而来,过程如下
$Gamma(a)=int_0^infty {x^{a-1}e^{-x}dx}quadquad ext{伽马函数}$
$Gamma(n)=(n-1)Gamma(n-1)=(n-1)!Gamma(1)$
$Gamma(frac{1}{2})=pi^{frac{1}{2}}$
设$x = mu eta = varphi (mu )$
根据$x = varphi (mu ),int {f(x)g(x)} dx = int {f circ } varphi (mu )g circ varphi (mu )varphi '(mu )$
得到:$Gamma (a) = {eta ^a}int_0^infty {{mu ^{a - 1}}{e^{ - mu eta }}dmu } $
所以伽马分布(概率密度函数)为: $f(mu|a,eta)=frac{eta ^a}{Gamma (a)} {mu ^{a - 1}}{e^{ - mu eta }}$
这样,在对 $f(mu|a,eta)$求$int_0^{+infty}$的时候(伽马分布的概率分布函数),结果永远等于1.
卡方分布
公式:$f(x) = frac{1}{{{2^{n/2}}Gamma (n/2)}}{x^{n/2 - 1}}{e^{ - x/2}}$
这是一个自由度为2的卡方分布,其实是一个$Gamma$分布的变形,当$alpha = 1$ , 并且$eta = 1/2$的$Gamma$分布。
为什么要叫卡方分布呢?这个公式又跟正态分布有千丝万缕的关系,对于一个随机变量$X$,服从标准正态分布,则$X$的随机变量的平方$Y=X^2$便服从自由度为1的卡方分布,推导过程略去,自由度该如何取值呢? 如果一个随机变量自由度就是1,如果是$X_1....X_k$自由度就是k了,并且$X_1^2....X_k^2$服从自由度为k的卡方分布。就是正态分布的随机变量的平方就是卡方分布。