零:基础知识
常见函数的导数:
[(log_a x)' = frac 1 {x ln a} \
(a^x) = a^x ln a \
( an x)' = sec^2 x \
(cot x)' = -csc^2 x \
(sec x)' = sec x an x \
(csc x)' = - csc x cot x \
(arcsin x)' = frac 1 {sqrt{1 - x^2}} \
(arccos x)' = - frac 1 {sqrt{1 - x^2}} \
(arctan x)' = frac 1 {1 + x^2} \
(mathrm{arccot} x)' = - frac 1 {1 + x^2}
]
泰勒展开:
[e^x = sum_{k=0}^{infty}frac{x^k}{k!} \
f(x)=sum_{k=0}^infty frac{f^{(k)}(x_0)cdot(x-x_0)^k}{k!}
]
第一章:随机事件与概率
概率空间:((Omega,F,P))
[P(A - B) = P(A) - P(AB) \
P(A + B) = P(A) + P(B) - P(AB) \
古典概型:P(A) = frac m n \
几何概型:P(A) = frac{L(A)}{L(Omega)} \
条件概率:P(A|B) = frac{P(AB)}{P(B)} \
]
事件的独立性
第二章:随机变量及其概率分布
分布律:
离散:P
连续:f
二项分布:
n重伯努利试验,事件发生k次的概率为:
[Xsim B(n,p)\
p_k = P(X = k) = C_n^k p^k (1 - p)^{n - k}=b(k;n,p), k=0,1,...,n \
]
泊松分布:
[Xsim P(lambda) \
P(X=k)=e^{-lambda}frac{lambda^k}{k!}=p(k; lambda), lambda >0, k=0,1,...
]
当 n 很大((nge20)),p 很小((ple0.05))时,可用泊松分布模拟,即
[b(k; n, p) approx p(k;np)
]
指数分布:
[f(x) = lambda e^{-lambda x}I_{[0,+infty)}(x))
]
正态分布:
[f(x) = frac{1}{sqrt{2pi}sigma}e^{-frac{(x-mu)^2}{2sigma^2}}\
Xsim N(mu, sigma^2)
ightarrow frac{x-mu}sigma sim N(0, 1)
]
正态分布具有独立可加性
第三章:多为随机变量及其概率分布
X、Y独立,即:
[F(x,y)=F_X(x)F_Y(y)
]
泊松分布与正态分布的再生性
卷积公式:
[若X,Y相互独立,则Z=X+Y有:\
f_Z(z)=int_{-infty}^infty f_X(x)f_Y(z-x)
]
随机变量最值的分布
第四章:随机变量的数字特征
期望与方差:
- 二项分布:E = np, D = np(1-p)
- 泊松分布:(E(X) = lambda,D(X)=lambda)
- 均匀分布:(E(X)=frac{a+b}2,D(X)=frac{(b-a)^2}{12})
- 正态分布:(E(X)=mu,D(X)=sigma^2)
- 指数分布:(E(X)=frac 1lambda,D(X)=frac 1{lambda^2})
期望的存在性:
[离散:sum_{kge0}|x_k|p_k<infty时存在\
连续:int_{-infty}^infty|x|f(x)dx<infty 时存在
]
随机变量的函数的期望:
[Y=g(x)\
E(Y)=int_{-infty}^infty g(x)f(x)dx
]
均匀分布中数学期望的几何意义
方差:
[D(X)=E{[X-E(X)]^2}=int_{-infty}^infty[X-E(X)]^2f(x)dx\
=E[X^2-2E(X)X+E(X)^2]=E(X^2)-E(X)^2
]
方差的性质:
[D(CX)=C^2X\
D(Xpm Y)=D(X)+D(Y)pm 2E{[X-E(X)][Y-E(Y)]}=D(X)+D(Y)pm 2Cov(X,Y)\
XY独立时:D(Xpm Y)=D(X)+D(Y)
]
切比雪夫不等式:
[P[|X-E(X)|geepsilon]lefrac{D(X)}{epsilon^2}
]
协方差:
[Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}=E(XY)-E(X)E(Y)
]
协方差的性质:
[cov(aX, bY)=abcov(X,Y)\
cov(X_1+X_2,Y)=cov(X_1,Y)+cov(X_2,Y)
]
相关系数:
[
ho_{XY}=frac{Cov(X,Y)}{sqrt{D(X)D(Y)}}
]
第五章:概率极限定理
中心极限定理:
[若X_1,X_2,...,X_n独立同分布,且E(X_k)=mu,D(X_k)=sigma^2(k=0,1,,...,n)\
则有sum_{k=1}^n X_k frac{近似}sim N(nmu,nsigma^2)
]
对于X服从两点分布的情况,我们有
[若P(X_k=1)=p\
则sum_{k=1}n X_kfrac{近似}sim N(np,np(1-p))\
即frac{X-np}{sqrt{np(1-p)}}frac{近似}sim N(0,1)
]
第六章:数理统计的基本概念
总体:全部可能观察值X
简单随机样本:(X_1,X_2,...,X_n)
样本值:(x_1,x_2,...,x_n)
统计量:(g(X_1,X_2,...,X_n))(一个不含未知参数的简单随机样本的函数)
[样本方差:S^2=frac 1{n-1} sum_{i=1}^n(X_i-overline{X})^2 \
样本k阶原点矩:A_k=frac 1 nsum_{i=1}^nX_i^k \
样本k阶中心矩:B_k=frac 1 nsum_{i=1}^n(X_i-overline X)^k
]
(chi^2)分布:
[X_1,X_2,...,X_nsim N(0,1)\
chi^2=X_1^2+X_2^2+...+X_n^2sim chi^2(n)
]
性质:
[若chi_1^2sim chi^2(n_1),chi_2^2sim chi^2(n_2),且chi_1^2与chi_2^2独立,则chi_1^2+chi_2^2sim chi^2(n_1+n_2) \
若chi^2sim chi^2(n),则E(chi^2)=n,D(chi^2)=2n
]
t分布:
[设Xsim N(0,1), Ysim chi^2(n),且X,Y独立,则\
t=frac X {sqrt{frac Y n}}sim t(n)
]
当(n oinfty)时,t分布与正态分布相似;
关于Y轴对称
F分布
[Usim chi^2(n_1), Vsim chi^2(n_2), U与V相互独立,则\
F=frac{U/n_1}{V/n_2}sim F(n1, n2)
]
正态总体样本的平均值和方差的性质:
[设X_1,X_2,...,X_n是来自正态总体N(mu,sigma^2)的样本,overline X和S^2分别是样本均值和方差,则有:\
overline X sim N(mu,frac{sigma^2}n)(重要)\
frac{(n-1)S^2}{sigma^2}sim chi^2(n-1)即frac{sum(X_i-overline X)^2}{sigma^2}sim chi^2(n-1)(重要)\
overline X与S^2独立\
frac{overline X-mu}{sqrt{S^2/n}}sim t(n-1)
]
第七章 参数估计
(hat{ heta}(X_1,X_2,...,X_n): heta 的估计量(本质上是一个统计量))
(hat{ heta}(x_1,x_2,...,x_n)=hat{ heta}: heta的估计值)
矩估计:
[总体k阶矩:mu_k=E(X^k),含有参数 heta\
样本k阶矩:A_k=frac 1 n sum_{i=1}^nX_k\
令mu_k=A_k,解方程即可
]
最大似然估计:
解方程使得(L( heta)=P(X_1=x_1,X_2=x_2,...,X_n=x_n))取得最大值
即
[L( heta)=prod_{i=1}^n P(X_i=x_i)或prod_{i=1}^n f(x_i)取得最大值
]
解法:取对数后求导
(hat{ heta}的无偏性:E(hat{ heta})= heta),指示估计量是否均匀分布在实际值两侧
方法:写出(E(hat{ heta}))与(X_i)的关系式;写出( heta)与X的关系式;判断是否相等
假设检验
(sigma^2)未知时关于(mu)的检验:
[检验统计量:frac{overline X - mu_0}{sqrt{S^2/n}} \
拒绝域:W={|检验统计量|>t_{frac a 2}(n-1)}, 假设mu=mu_0\
W={检验统计量>t_a(n-1)}, 假设mu le mu_0
]
当样本观测值落入拒绝域中时,认为假设不成立。