CH2 随机变量及概率分布
随机变量就是实验结果的函数。随机变量的反面是所谓“确定性变量”。
概率函数和分布函数。
二项分布:X~B(n, p)
泊松分布:X~P(lambda)
泊松分布可作为二项分布的极限而得到。一般地说,若X~B(n, p),其中n很大,p很小而np=lambda不太大时,则X的分布接近于泊松分布P(lambda)。
超几何分布与二项分布的区别主要在于,二项分布是放回抽取,超几何分布是不放回抽取,两者在n趋向无穷时近似相同。
二项分布是定下总抽样个数n而把废品个数X作为变量;负二项分布则相反,它定下废品个数r而把总抽样次数减去r作为变量。一个重要的特例是,r=1时为几何分布。
概率分布函数和概率密度函数。
指数分布描述了无老化时的寿命分布,但“无老化”是不可能的,因而只是一种近似。若考虑老化,则应取失效率随时间而上升,不能为常数,即威布尔分布。
完备事件群:事件两两互斥,和为必然事件。
多项分布:将一个体按某种属性分成几类。N=2时,即二项分布。
随机向量的概率分布函数和概率密度函数。
二维正态分布的概率密度函数在坐标平面上是一个椭圆,椭圆中心在(a, b)点。
边缘分布和边缘密度函数、边缘分布函数。
一个随机向量X的分布F足以决定其任意分量Xi的边缘分布,但反过来不对:即使知道了所有Xi的边缘分布Fi,也不足以决定X的分布F。因为边缘分布只分别考虑了单个变量Xi的情况,而未涉及他们之间的关系,而这个信息却是包含在(X1,…,Xn)的分布之内的。边缘分布就是通常的分布,并无任何特殊的含义。
两个随机变量X1和X2联合密度函数,等于其中之一的概率密度乘以在给定这一个之下另一个的条件概率密度。这相应于条件概率公式P(AB)=P(B)P(A|B)。
正态变量的条件分布仍为正态。
对于二维正态分布的 ho,通常把 ho>0的情况成为“正相关”,而 ho<0的情况称为“负相关”。
X1与X2独立:f(x1, x2)=f1(x1)f2(x2)。
实际问题中,变量的独立性往往不是从其数学定义去验证出来的。相反,常是从变量产生的实际背景判断他们独立(或者其相依性很微弱因而可近似地认为是独立),然后再使用独立性定义中所赋予的性质和独立性的有关定理。
连续型分布的情况:有点复杂。
两个独立的正态变量的和仍服从正态分布,且有关的参数相加。这个事实的逆命题也成立:如果Y服从正态分布,而Y表成两个独立随机变量X1X2之和,则X1X2必都服从正态分布。这个事实称为正态分布的“再生性”。
Gamma函数:有点复杂。
若X1…Xn相互独立,都服从正态分布N(0, 1),则Y=平方和服从自由度为n的卡方分布。
X1X2独立,X1服从自由度为n的卡方分布,X2服从正态分布N(0, 1),Y=X2/sqrt(X1/n)服从自由度为n的t分布。
若X1X2独立,X1服从自由度为n的卡方分布,X2服从自由度为m的卡方分布,则Y=(m^-1)X2/(n^-1)X1服从自由度为m, n的F分布。