伯努利实验:
如果无穷随机变量序列 是独立同分布(i.i.d.)的,而且每个随机变量
都服从参数为p的伯努利分布,那么随机变量
就形成参数为p的一系列伯努利试验。同样,如果n个随机变量
独立同分布,并且都服从参数为p的伯努利分布,则随机变量
形成参数为p的n重伯努利试验。
伯努利试验是只有两种可能结果的单次随机试验。
- 如果试验E是一个伯努利试验,将E独立重复地进行n次,则称这一串重复的独立试验为n重伯努利试验。
一、伯努利分布:
伯努利分布亦称“零一分布”、“两点分布”。称随机变量X有伯努利分布, 参数为p(0<p<1),如果它分别以概率p和1-p取1和0为值。EX= p,DX=p(1-p)。伯努利试验成功的次数服从伯努利分布,参数p是试验成功的概率。伯努利分布是一个离散型机率分布,是N=1时二项分布的特殊情况,为纪念瑞士科学家詹姆斯·伯努利(Jacob Bernoulli 或James Bernoulli)而命名。
例子:假定重复抛掷一枚均匀硬币,如果在第i次抛掷中出现正面,令 ;如果出现反面,令
,那么,随机变量
就形成参数为
的一系列伯努利试验,同样,假定由一个特定机器生产的零件中10%是有缺陷的,随机抽取n个进行观测,如果第i个零件有缺陷,令
;如果没有缺陷,令
,那么,随机变量
就形成参数为
的n重伯努利试验 (百度百科)
E(X)=p, E(X2)=q , Var(X)=pq
二、二项分布:
n 次Bernoulli试验的结果中,每次试验的分布不变,结果为1的次数 X 的分布。就是重复n次的伯努利实验。
在概率论和统计学里面,带有参数n和p的二项分布表示的是n次独立试验的成功次数的概率分布。在每次独立试验中只有取两个值,表示成功的值的概率为p,那么表示试验不成功的概率为1-p。这样一种判断成功和失败的二值试验又叫做伯努利试验。
特殊地,当n=1的时候,我们把二项分布称为伯努利分布。
超几何分布,n 次伯努利试验,每次试验分布发生改变,结果为1的次数 X 的分布,当试验分布变化不大的时候和二项分布结果相同
它描述了从有限N个物件(其中包含M个指定种类的物件)中抽出n个物件,成功抽出该指定种类的物件的次数(不放回)
![](https://img2018.cnblogs.com/blog/1252909/201903/1252909-20190321110325244-1770666914.png)
![](https://gss2.bdstatic.com/-fo3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D204/sign=6f6d394f364e251fe6f7e3f89387c9c2/aa18972bd40735fac894d5cc98510fb30f24085a.jpg)
泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生次数。 泊松分布适合于描述单位时间内随机事件发生的次数。
k事件X发生的频数;P(X=k)事件X发生k次的概率
泊松分布的期望和方差均为
特征函数为
当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,其中λ为np。通常当n≧20,p≦0.05时,就可以用泊松公式近似得计算,当n趋近于无穷的时候等同于二项分布。
五、多项分布
是二项式分布的推广。二项式做n次伯努利实验,规定了每次试验的结果只有两个,如果现在还是做n次试验,只不过每次试验的结果可以有多m个,且m个结果发生的概率互斥且和为1,则发生其中一个结果X次的概率就是多项式分布。
扔骰子是典型的多项式分布。扔骰子,不同于扔硬币,骰子有6个面对应6个不同的点数,这样单次每个点数朝上的概率都是1/6(对应p1~p6,它们的值不一定都是1/6,只要和为1且互斥即可,比如一个形状不规则的骰子),重复扔n次,如果问有k次都是点数6朝上的概率。
六、负二项分布
一种离散概率分布。满足以下条件的称为负二项分布:实验包含一系列独立的实验, 每个实验都有成功、失败两种结果,成功的概率是恒定的,实验持续到r次成功,r为正整数。
![](https://gss3.bdstatic.com/-Po3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D233/sign=74c7991f46a7d933bba8e3709e4ad194/b21c8701a18b87d65c0b0814030828381f30fd74.jpg)
![](https://gss1.bdstatic.com/9vo3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D36/sign=9c4ed1172ba446237acaa3649922effd/2cf5e0fe9925bc31ad0caaf555df8db1cb13700e.jpg)
七、gamma分布
是统计学的一种连续概率函数。
gamma函数定义:
Γ(x) = ∫0∞ tx-1 e-t dt Γ(x+1) = x Γ(x); Γ(x+1) = x!
Gamma分布中的参数α称为形状参数(shape parameter),β称为逆尺度参数(scale parameter)
![](https://gss3.bdstatic.com/-Po3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D224/sign=b33fd4be8f18367aa98978df1a728b68/54fbb2fb43166d224c240c034f2309f79152d2d1.jpg)
![](https://gss3.bdstatic.com/-Po3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D155/sign=cf0eacad10d8bc3ec20802cfb78aa6c8/1ad5ad6eddc451da2244157cbffd5266d11632f2.jpg)
![](https://gss3.bdstatic.com/-Po3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D117/sign=c88c6f9cf1dcd100c99cfc20458a47be/d833c895d143ad4b225883518b025aafa40f0629.jpg)
![](https://gss0.bdstatic.com/-4o3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D10/sign=a85d8b44edcd7b89ed6c3e830e244645/7acb0a46f21fbe091739489a60600c338644addd.jpg)
![](https://gss1.bdstatic.com/-vo3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D35/sign=93d0b4499b52982201333fc6d5caece6/bd315c6034a85edf584276ad42540923dc547576.jpg)
![](https://gss3.bdstatic.com/7Po3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D70/sign=332c968a3f9b033b2888feda14cef5f0/bd3eb13533fa828b4118166df61f4134970a5a01.jpg)
![](https://gss1.bdstatic.com/9vo3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D37/sign=644db2699a2397ddd2799e035882df6b/4610b912c8fcc3cec28842bd9945d688d53f20f7.jpg)
![](https://gss3.bdstatic.com/7Po3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D70/sign=332c968a3f9b033b2888feda14cef5f0/bd3eb13533fa828b4118166df61f4134970a5a01.jpg)
![](https://gss3.bdstatic.com/-Po3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D35/sign=9eccbf573201213fcb3348d956e72dce/80cb39dbb6fd5266c3cab79aa018972bd507365e.jpg)
![](https://gss3.bdstatic.com/7Po3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D70/sign=332c968a3f9b033b2888feda14cef5f0/bd3eb13533fa828b4118166df61f4134970a5a01.jpg)
八、指数分布
指数分布是事件的时间间隔的概率。如:
-
婴儿出生的时间间隔
-
来电的时间间隔
-
奶粉销售的时间间隔
-
网站访问的时间间隔
是描述泊松过程中的事件之间的时间的概率分布,即事件以恒定平均速率连续且独立地发生的过程。 这是伽马分布的一个特殊情况,它是几何分布的连续模拟,它具有无记忆的关键性质。
指数函数的一个重要特征是无记忆性(Memoryless Property,又称遗失记忆性)。这表示如果一个随机变量呈指数分布,当s,t>0时有P(T>t+s|T>t)=P(T>s)。即,如果T是某一元件的寿命,已知元件使用了t小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s小时的概率相等。
期望值: ,方差:
若随机变量x服从参数为λ的指数分布,则记为
。
九、卡方分布
若n个相互独立的随机变量ξ₁,ξ₂,...,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和 构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。其中参数
称为自由度。记为
或者
(其中
,
为限制条件数)。
卡方分布是由正态分布构造而成的一个新的分布,当自由度 很大时,
分布近似为正态分布。
1) 分布在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着参数
的增大,
分布趋近于正态分布;卡方分布密度曲线下的面积都是1.
2) 分布的均值与方差可以看出,随着自由度
的增大,χ2分布向正无穷方向延伸(因为均值
越来越大),分布曲线也越来越低阔(因为方
越来越大)。
![](https://gss2.bdstatic.com/9fo3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D97/sign=f146e13bb0119313c343f3b76438c580/c8177f3e6709c93dd2ca210e9d3df8dcd100540a.jpg)
![](https://gss1.bdstatic.com/-vo3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D107/sign=646ea9179e82d158bf825db1b70b19d5/d788d43f8794a4c2c879c8d20cf41bd5ac6e39f4.jpg)
![](https://gss3.bdstatic.com/7Po3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D20/sign=6547b0c06963f624185d3e038644e34c/9358d109b3de9c824600c2766e81800a18d843e5.jpg)
![](https://gss3.bdstatic.com/7Po3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D47/sign=83ed9ac31bd8bc3ec20807cd838b1d69/3812b31bb051f81969742cb3d8b44aed2f73e7f2.jpg)
十、Beta分布
B函数,又称为Beta函数或者第一类欧拉积分,是一个作为伯努利分布和二项式分布的共轭先验分布的密度函数,是指一组定义在(0,1) 区间的连续概率分布,定义如下:
有两个参数
实例:
十一、几何分布
是离散型概率分布。在n次伯努利试验中,试验k次才得到第一次成功的机率。详细地说,是:前k-1次皆失败,第k次成功的概率。几何分布是帕斯卡分布当r=1时的特例。
![](https://gss2.bdstatic.com/9fo3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D234/sign=e566e701104c510faac4e51954582528/4a36acaf2edda3cc1efb81e90be93901203f92df.jpg)
![](https://gss2.bdstatic.com/9fo3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D67/sign=a4fca916c41b9d168ec79966f2de3c6b/0e2442a7d933c8950379a3b2db1373f0830200f7.jpg)
![](https://gss2.bdstatic.com/9fo3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D109/sign=b879d7cac295d143de76e0234af28296/4bed2e738bd4b31c7ddfaf728dd6277f9f2ff81c.jpg)
![](https://gss3.bdstatic.com/-Po3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D92/sign=4e87eb24ed1190ef05fb9eddcc1b20d8/962bd40735fae6cdb03b90a805b30f2443a70f6f.jpg)
![](https://gss3.bdstatic.com/-Po3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D109/sign=5005ba76865494ee83220b1914f7e0e1/94cad1c8a786c917dce569f0c33d70cf3ac75710.jpg)
十二、学生分布(t分布)
用于根据小样本来估计呈正态分布且方差未知的总体的均值。如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。
t分布曲线形态与n(确切地说与自由度df)大小有关。与标准正态分布曲线相比,自由度df越小,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度df愈大,t分布曲线愈接近正态分布曲线,当自由度df=∞时,t分布曲线为标准正态分布曲线。
![](https://gss3.bdstatic.com/-Po3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D244/sign=703489758d01a18bf4eb154baa2e0761/08f790529822720ef713eda371cb0a46f31fab8e.jpg)
十三、正态分布
十四、狄利克雷分布
狄利克雷分布(Dirichlet distribution)是多项分布的共轭分布,也就是它与多项分布具有相同形式的分布函数。同时可以看做是将Beta分布推广到多变量的情形。一类在实数域以正单纯形(standard simplex)为支撑集(support)的高维连续概率分布,是Beta分布在高维情形的推广。
对独立同分布(independent and identically distributed, iid)的连续随机变量 和支撑集
,若
服从狄利克雷分布,则其概率密度函数
![](https://gss1.bdstatic.com/9vo3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D70/sign=8e6f7965174c510faac4e01a6159fdf5/d009b3de9c82d158c594fe1c8d0a19d8bc3e420c.jpg)
![](https://gss1.bdstatic.com/-vo3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D289/sign=2fea3d946663f624185d3e0bbe46eb32/902397dda144ad348477312adda20cf430ad8557.jpg)
![](https://gss2.bdstatic.com/-fo3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D17/sign=dd44e5a48a44ebf869716038d8f9fff2/cdbf6c81800a19d80a1a58a23efa828ba61e4678.jpg)
是分布参数的和,
![](https://gss0.bdstatic.com/-4o3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D34/sign=09beb262a251f3dec7b2bf6095ee3971/d01373f082025aaf30a70463f6edab64024f1a84.jpg)
是多元Beta函数(multivariate beta function),
![](https://gss3.bdstatic.com/7Po3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D33/sign=364d870ddc43ad4ba22e40c383025e44/6a600c338744ebf8f5321e97d4f9d72a6159a7d3.jpg)
为Gamma函数。由上述解析形式可知,狄利克雷分布是指数族分布 [1] 。
应用
泊松分布和负二项分布用途区分
https://www.jianshu.com/p/ad24bb90b972
---------------------
原文:https://blog.csdn.net/tonyshengtan/article/details/82947416