zoukankan      html  css  js  c++  java
  • 【概率论与数理统计】全概率公式和贝叶斯公式

    :很久以前就知道这两个公式,但一直仅限于了解。直到最近学习edx上的课程,才对这两个公式有了新的理解,记录于此。

    1. 条件概率公式


     设A, B是两个事件,且P(B)>0, 则在事件B发生的条件下,事件A发生的条件概率(conditional probability)为:

    P(A|B)=P(AB)/P(B)

    条件概率是理解全概率公式和贝叶斯公式的基础,可以这样来考虑,如果P(A|B)大于P(A)则表示B的发生使A发生的可能性增大了。

    在条件概率中,最本质的变化是样本空间缩小了——由原来的整个样本空间缩小到了给定条件的样本空间。

    2. 乘法公式


     2.1 乘法公式

    由条件概率公式得:

     P(AB) = P(B)·P(A|B) = P(A)·P(B|A)

    上面的式子就是乘法公式。

    2.2 乘法公式的推广

    对于任何正整数n≥2,当P(A1A2...An-1) > 0 时,有:

    P(A1A2...An-1An) = P(A1)P(A2|A1)P(A3|A1A2)...P(An|A1A2...An-1)

    3. 全概率公式


     3.1 前提假设

    设B1,B2,....为有限或无限个事件,它们两两互斥且在每次试验中至少发生一个,即:

    • 不重,Bi ∩ Bj = ∅(不可能事件)i≠j ,
    • 不漏,B1∪B2∪.... = Ω(必然事件).

      图1:B- Bn是对S的一个划分

    这时,称事件组 B1, B2,...是样本空间S的一个划分,把具有这些性质的一组事件称为一个“完备事件组”。

    设 B1, B2,...是样本空间S的一个划分,A为任一事件(图1中红圈内部区域),则:

    $$P(A) = displaystyle sum_{ i = 1 }^{ n } P(B_i)P(A|B_i) hspace{ 10pt } (1)$$

     上式即为全概率公式(formula of total probability)

     也可以分为两步来看全概率公式:

     

    图2:分两步看全概率公式,S先被划分为n个子集B- Bn,然后每个子集的发生会对A的发生产生不同程度的影响

    设P(Bj) = pj, P(A|Bj) = qj, j = 1, 2, ..., n

    则$$P(A) = displaystyle sum_{ j = 1 }^{ n } p_{j}q_{j} hspace{ 10pt } (2)$$

    在运用全概率公式时的已知未知条件为:

    • 划分后的每个小事件的概率,即P(Bi), i = 1, 2, ..., n;
    • 每个小事件发生的条件下,A发生的概率,即P(A|Bi), i = 1, 2, ..., n;
    • 求解目标是计算A发生的概率,即P(A)。

    3.2 意义

    全概率公式的意义在于,当直接计算P(A)较为困难,而P(Bi),P(A|Bi)  (i=1,2,...)的计算较为简单时,可以利用全概率公式计算P(A)。思想就是,将事件A分解成若干个小事件,通过求每个小事件的概率,然后相加从而求得事件A的概率。

    而将事件A进行分割的时候,不是直接对A进行分割,而是先找到样本空间S的一个划分B1,B2,...Bn,这样事件A就被事件AB1,AB2,...ABn分解成了n部分,即A = AB1 + AB2 + ... + ABn, 每一Bi发生都可能导致A发生相应的概率是P(A|Bi),由加法公式得

        P(A) = P(AB1) + P(AB2) + .... + P(ABn)

    = P(B1)P(A|B1) + P(B2)P(A|B2) + ... +P(Bn) P(A|Bn)

    4. 贝叶斯公式


    与全概率公式解决的问题相反,贝叶斯公式是建立在条件概率的基础上寻找事件发生的原因(即大事件A已经发生的条件下,分割中的小事件Bi在A发生的条件下的概率),设B1,B2,...是样本空间S的一个划分,则对任一事件A(P(A)>0),有

    $$P(B_i|A) = frac{P(B_i)P(A|B_i)}{displaystyle sum_{ j = 1 }^{ n }P(B_j)P(A|B_j)} hspace{ 10pt } (3)$$

    上式即为贝叶斯公式(Bayes formula),B常被视为导致试验结果A发生的“原因”,P(Bi)(i=1,2,...)表示各种原因发生的可能性大小,故称先验概率(权重);P(Bi|A)(i=1,2...)则反映当试验产生了结果A之后,再对各种原因概率的新认识,故称后验概率。

    如果参考图2,分成两步来看,B发生在A之前,且B有多种情况(B1 - Bn)。在运用贝叶斯公式时,一般已知和未知条件为:

    • B的多种情况中到底哪种情况发生了是未知的,但是每种情况发生的概率已知,即P(Bj);
    • 事件A是已经发生的确定事实,且每种B发生条件下A发生的概率已知,即P(A|Bj);
    • P(A)未知,需要使用全概率公式计算得到;
    • 求解的目标是用B的某种情况Bi的无条件概率求其在A发生的条件下的有条件概率P(Bi|A)

    5. 小结


    如果我们把事件A看成“结果”,把诸事件B1,B2,…看成是导致这个结果的可能的“原因”,则可以形象地把全概率公式看做“由原因推结果”;而贝叶斯公式则恰好相反,其作用在于“由结果推原因”:现在有一个“结果”A已经发生了,在众多可能的“原因”中,到底是哪一个导致了这个结果?这是一个在日常生活和科学技术中常要问到的问题。贝叶斯公式说,各原因可能性的大小与P(Bi|A)成比例。

    贝叶斯公式最神奇之处在于将条件概率中的因和果调换了位置,可以用下面的式子表示:

    P(B|A) = P(因|果) = P(因)P(果|因)/P(果)

    6. 例题


    问题1

    设某公路经过的货车与客车的数量之比为1:2,货车中途停车修车的概率为0.02,客车为0.01,今有一辆汽车中途停车修理,则该车是货车的概率是多少?

    解答

     原本汽车中途停车维修的概率应该与车的数量成正比,即在只考虑车的数量时,停下来的车为货车的概率为P(A1),即1/3;

    但是当我们进一步观察,加入更多的信息(每种类型的车的停车维修的概率)后,判断停下来的车为货车的概率增加到了1/2,也就是说B的发生使得A1(观察到货车停下来维修)发生的概率变大了。(货车的数量虽然少,但是经过长期观察,货车出故障的概率是客车的2倍<获得了新的信息>,因此货车停在路边维修的概率就增加了)

    问题2:

     装有10件某产品(乒乓球)(其中一等品5件,二等品3件,三等品2件)的箱子中丢失一件产品,但不知是几等品,今从箱中任取2件产品,结果都是一等品,则丢失的也是一等品的概率为?

    解答

    由于我们不知道丢失了哪种球,最直接的猜测就是丢每种球的概率与球的数量成正比。即,丢的球是一等品的概率为1/2 = P(A1)。

    但是为了更加准确的推测到底丢了什么球,只能通过一些可行的方法,获得更多的信息。这里采用了"任取两个球出来"这种试验方法,然后根据试验结果得到了更加准确的结果3/8,也就是说,这一结果降低了我们前面直接根据球的数量预测出的概率。(因为任取两个都是一等品,说明剩下的球中,取到一等品的概率很大,因此丢的可能性就变小了)

    问题3

    爱丽丝的口袋里有5枚硬币:两枚是正常的硬币(都有正反两面,normal),两枚硬币的两面都是正面(double-head),最后一枚硬币的两面都是背面(double-tail)。她随机取出一枚硬币,也没看是哪种硬币,然后投掷:

    a). 硬币落地后,朝下的一面为正面的概率?

    b). 硬币落地后,正面朝上,那么朝下的一面也是正面的概率?

    c). 如果爱丽丝将b)中取到的硬币丢掉,重新从口袋中取出一枚硬币,还是没看是哪种硬币,然后投掷,则当硬币落地后正面朝上的概率?

    解答

    首先,整个事情分成了两个大的步骤:

    1. 第一步取出一个硬币(相当于图2中的B,有多种类型的硬币可以取);
    2. 抛出硬币,得到硬币落地后的结果(相当于图2中的A)。

    设,取出的硬币为normal硬币为事件Bn;

    取出的硬币为double-head硬币为事件Bh

    取出的硬币为double-tail硬币为事件Bt

    硬币落地后正面朝上为事件Ahu

    硬币落地后正面朝下为事件Ahd

    硬币落地后背面朝上为事件Atu

    硬币落地后背面朝下为事件Atd

    a). 需要求P(Ahd)(正面朝下的概率)。取到不同的硬币Bn/Bh/Bt,得到的P(Ahd)也不同,Ahd被分成了三种情况。

    由特意可得:

    • P(Bn) = 2/5,即从5枚硬币中取到正常硬币的概率;
    • P(Bh) = 2/5,即从5枚硬币中取到double-head的概率;
    • P(Bt) = 1/5,即从5枚硬币中取到double-tail的概率;
    • P(Ahd|Bn) = 1/2,即取到正常硬币时,可以得到正面朝下的概率;
    • P(Ahd|Bh) = 1,即取到double-head时,可以得到正面朝下的概率(硬币本身两面都是正面,所以概率为1);
    • P(Ahd|Bt) = 0,即取到double-tail时,可以得到正面朝下的概率(硬币本身两面都是反面,不可能得到正面朝下的情况,所以概率为0);

    全概率公式,得:

    P(Ahd) = P(Bn)*P(Ahd|Bn) + P(Bh)*P(Ahd|Bh) + P(Bt)*P(Ahd|Bt)

               = 2/5*1/2 + 2/5*1 + 1/5*0

               = 3/5

    b). 根据问题和假设,这里要求解的是条件概率P(Ahd|Ahu),说明两面都是正面,因此等价于求P(Bh|Ahu)。

    参考图2,事件B发生在事件A之前,B有两种情况可能导致Ahu,具体发生了哪种是未知的。(有点像由结果推原因

    由题意可得:

    • 可能导致Ahu发生的两种B为:Bn或Bh
    • P(Bn) = P(Bh) = 2/5;
    • 参考问题a,可以根据全概率公式计算出Ahu = Ahd = 3/5;
    • P(Ahu|Bh) = 1,取到double-head时,可以得到正面朝上的概率(硬币本身两面都是正面,所以概率为1);

    由贝叶斯公式,得:

    P(Bh|Ahu) = P(Bh*Ahu)/P(Ahu)

              = P(Bh)*P(Ahu|Bh)/P(Ahu)

              = 2/5 * 1 / (3/5)= 2/3

    c). 这个问题稍微有点复杂,但也可以分情况讨论:

    设该问题——第二次取出的硬币落地后正面朝上,为事件C.

    # 第一次分情况

    由b)可以知道,b)中取到的硬币只有两种情况(Bn或Bh),Bn与Bh是一组对立事件。

    根据已知的条件,可得:

    • 第一次取出的硬币为double-head硬币的概率为P(Bh) = P(Bh|Ahu) = 2/3;
    • 第一次取出的硬币为正常硬币的概率为P(Bn) = 1 - P(Bh|Ahu) = 1 - 2/3 = 1/3;
    • P(Bn2) =  P(Bh)*P(Bn) + P(Bn)*P(Bn) = 2/3 * 2/4 + 1/3 * 1/4 = 5/12,即第二次取到Bn的概率;
    • P(Bh2) =  P(Bh)*P(Bh) + P(Bn)*P(Bh) = 2/3 * 1/4 + 1/3 * 2/4 = 4/12,即第二次取到Bh的概率;
    • P(Ahu|Bn2) = 1/2,即第二次取到正常硬币时,可以得到正面朝上的概率;
    • P(Ahu|Bh2) = 1,即第二次取到double-head硬币时,可以得到正面朝上的概率;
    • 此时的Bh和Bn本质上是在Ahu发生的条件下的条件概率(根据已知的事实计算出来的后验概率),而不再是之前的2/5(先验概率);

    # 第二次分情况

    此时的C仍然可以分为两种情况,第二次取到正常硬币或取到double-head硬币。

    全概率公式,得:

    P(C) = P(Bn2)*P(Ahu|Bn2) + P(Bh2)*P(Ahu|Bh2

            = 5/12 * 1/2 + 4/12 * 1

            = 13/24

    欢迎阅读“概率论与数理统计及Python实现”系列文章

    参考:


    http://www.cnblogs.com/ohshit/p/5629581.html

    edx上的公开课:MITx: 6.008.1x Computational Probability and Inference

    《概率论与数理统计》,陈希孺,中国科学技术大学出版社

     重大修订版:

    • 2017-7-15,添加示意图,补充定义,重新解释了例题的解答过程,补充了例题;

     

  • 相关阅读:
    linux向下向上查找
    安卓中的线程
    安卓 新浪微博随便看看
    平面图的基本概念及性质
    软件工程知识点总结
    磁盘阵列RAID原理、种类及性能优缺点对比
    面试题之------三次握手与四次挥手过程
    不忘初心
    考研彼岸,花开馨香
    In和Out指令
  • 原文地址:https://www.cnblogs.com/Belter/p/5923828.html
Copyright © 2011-2022 走看看