zoukankan      html  css  js  c++  java
  • 概率论疑难问题---2、通俗理解泊松分布

    概率论疑难问题---2、通俗理解泊松分布

    一、总结

    一句话总结:

    二、通俗理解泊松分布

    博客对应课程视频位置:2、通俗理解泊松分布-范仁义-读书编程笔记
    https://www.fanrenyi.com/video/45/385

    1、卖包子

    给大家讲讲我爸爸职业的故事。

    做木匠->开车->卖包子->卖包子->卖鸭脖子->去卖炒饭->开小牌馆

    每天早上六点到十点营业,生意挺好,就是发愁一个事情,应该准备多少个包子才能既不浪费又能充分供应?

    老板统计了周一到周五每日卖出的包子(为了方便计算和讲解,缩小了数据):

    均值为:

    $$overline { X } = frac { 3 + 7 + 4 + 6 + 5 } { 5 } = 5$$

    按道理讲均值是不错的选择,这样每天包子个数的偏离不会太大,但是如果每天准备5个包子的话,从统计表来看,至少有两天不够卖,40\%的时间不够卖:

    你家的“包子店”又不是小米,搞什么饥饿营销啊?老板当然也知道这一点,就拿起纸笔来开始思考。

    2、老板的思考

    老板尝试把营业时间抽象为一根线段,把这段时间用T来表示:

    然后把周一的三个包子按照销售时间放在线段上:

    把T均分为四个时间段:

    此时,在每一个时间段上,要不卖出了(一个)包子,要不没有卖出:

    在每个时间段,就有点像抛硬币,要不是正面(卖出),要不是反面(没有卖出):

    T内那么卖出3个包子的概率,就和抛了4次硬币(4个时间段),其中3次正面(卖出3个)的概率一样了。

    这样的概率通过二项分布来计算就是:

    $$left( egin{array} { l } { 4 } \ { 3 } end{array} ight) p ^ { 3 } ( 1 - p ) ^ { 1 }$$

    二项分布用符号b(x.n.p),表示在n次试验中有x次成功,成功的概率为p。

    二项分布的概率函数可写作:

    $$b ( x . n . p ) = C _ { n } ^ { x } p ^ { x } (1-p) ^ { n - x }$$

    式中x=0、1、2、3.....n为正整数

    $$C _ { n } ^ { x } = frac { n ! } { x ! ( n - x ) ! }$$

    但是,如果把周二的七个包子放在线段上,分成四段就不够了:

    从图中看,每个时间段,有卖出3个的,有卖出2个的,有卖出1个的,就不再是单纯的“卖出、没卖出”了。不能套用二项分布了。

    解决这个问题也很简单,把T分为20个时间段,那么每个时间段就又变为了抛硬币:

    这样,T内卖出7个包子的概率就是(相当于抛了20次硬币,出现7次正面):

    $$left( egin{array} { c } { 20 } \ { 7 } end{array} ight) p ^ { 7 } ( 1 - p ) ^ { 13 }$$

    为了保证在一个时间段内只会发生“卖出、没卖出”,干脆把时间切成n份:

    $$left( egin{array} { l } { n } \ { 7 } end{array} ight) p ^ { 7 } ( 1 - p ) ^ { n - 7 }$$

    越细越好,用极限来表示:

    $$lim _ { n ightarrow infty } left( egin{array} { c } { n } \ { 7 } end{array} ight) p ^ { 7 } ( 1 - p ) ^ { n - 7 }$$

    更抽象一点,T时刻内卖出k个包子的概率为:

    $$lim _ { n ightarrow infty } left( egin{array} { l } { n } \ { k } end{array} ight) p ^ { k } ( 1 - p ) ^ { n - k }$$

    3、p的计算

    “那么”,老板用笔敲了敲桌子,“只剩下一个问题,概率p怎么求?”

    在上面的假设下,问题已经被转为了二项分布。二项分布的期望为:

    $$E ( X ) = n p = mu$$

    那么:

    $$p = frac { mu } { n }$$

    4、泊松分布

    有了p=μ/n了之后,就有:

    $$lim _ { n ightarrow infty } left( egin{array} { l } { n } \ { k } end{array} ight) p ^ { k } ( 1 - p ) ^ { n - k } = lim _ { n ightarrow infty } left( egin{array} { l } { n } \ { k } end{array} ight) (frac { mu } { n } )^ { k }( 1 - frac { mu } { n } ) ^ { n - k }$$

    我们来算一下这个极限:

    $$lim _ { n ightarrow infty } left( egin{array} { l } { n } \ { k } end{array} ight) (frac { mu } { n })^{k} ( 1 - frac { mu } { n } ) ^ { n - k } = lim _ { n ightarrow infty } frac { n ( n - 1 ) ( n - 2 ) cdots ( n - k + 1 ) } { k ! } frac { mu ^ { k } } { n ^ { k } } ( 1 - frac { mu } { n } ) ^ { n - k } = lim _ { n ightarrow infty } frac { mu ^ { k } } { k ! } frac { n } { n } cdot frac { n - 1 } { n } cdots frac { n - k + 1 } { n } ( 1 - frac { mu } { n } ) ^ { - k } ( 1 - frac { mu } { n } ) ^ { n }$$

    其中:

    $$lim _ { n ightarrow infty } frac { n } { n } cdot frac { n - 1 } { n } cdots frac { n - k + 1 } { n } ( 1 - frac { mu } { n } ) ^ { - k } = 1$$
    $$lim _ { n ightarrow infty } ( 1 - frac { mu } { n } ) ^ { n } = e ^ { - mu }$$

    所以:

    $$lim _ { n ightarrow infty } left( egin{array} { l } { n } \ { k } end{array} ight) frac { mu } { n } ( 1 - frac { mu } { n } ) ^ { n - k } = frac { mu ^ { k } } { k ! } e ^ { - mu }$$

    上面就是泊松分布的概率密度函数,也就是说,在T时间内卖出k个包子的概率为:

    $$P ( X = k ) = frac { mu ^ { k } } { k ! } e ^ { - mu }$$

    一般来说,我们会换一个符号,让μ=λ,所以:

    $$P ( X = k ) = frac { lambda ^ { k } } { k ! } e ^ { - lambda }$$

    这就是教科书中的泊松分布的概率密度函数。

    5、包子店的问题的解决

    老板依然蹙眉,不知道μ啊?

    没关系,刚才不是计算了样本均值:

    $$overline { X } = 5$$

    可以用它来近似:

    $$overline { X } approx mu$$

    于是:

    $$P ( X = k ) = frac { 5 ^ { k } } { k ! } e ^ { - 5 }$$

    画出概率质量函数的曲线就是:

    可以看到,如果每天准备8个包子的话,那么足够卖的概率就是把前9个的概率加起来:

    这样93%的情况够用,偶尔卖缺货也有助于品牌形象。

    老板算出一脑门的汗,“那就这么定了!”

    6、总结

    这个故事告诉我们,要努力学习啊,要不以后卖包子都卖不过别人。

    生活中还有很多泊松分布。比如物理中的半衰期,我们只知道物质衰变一半的时间期望是多少,但是因为不确定性原理(这个理论是说,你不可能同时知道一个粒子的位置和它的速度),我们没有办法知道具体哪个原子会在什么时候衰变?所以可以用泊松分布来计算。

    还有比如交通规划等等问题。

    资料来源:https://www.matongxue.com/madocs/858/

    In [ ]:
     

    系列课程视频位置:

    1、全概率公式和贝叶斯公式-范仁义-读书编程笔记
    https://www.fanrenyi.com/video/45/382

    2、通俗理解泊松分布-范仁义-读书编程笔记
    https://www.fanrenyi.com/video/45/385

    3、通俗理解协方差与相关系数-范仁义-读书编程笔记
    https://www.fanrenyi.com/video/45/386

    4、通俗理解概率论中的“矩”-范仁义-读书编程笔记
    https://www.fanrenyi.com/video/45/387

    5、通俗理解中心极限定理-范仁义-读书编程笔记
    https://www.fanrenyi.com/video/45/388

    6、极大似然估计-范仁义-读书编程笔记
    https://www.fanrenyi.com/video/45/389

    7、通俗理解最小二乘法-范仁义-读书编程笔记
    https://www.fanrenyi.com/video/45/390

     
     
    我的旨在学过的东西不再忘记(主要使用艾宾浩斯遗忘曲线算法及其它智能学习复习算法)的偏公益性质的完全免费的编程视频学习网站: fanrenyi.com;有各种前端、后端、算法、大数据、人工智能等课程。
    博主25岁,前端后端算法大数据人工智能都有兴趣。
    大家有啥都可以加博主联系方式(qq404006308,微信fan404006308)互相交流。工作、生活、心境,可以互相启迪。
    聊技术,交朋友,修心境,qq404006308,微信fan404006308
    26岁,真心找女朋友,非诚勿扰,微信fan404006308,qq404006308
    人工智能群:939687837

    作者相关推荐

  • 相关阅读:
    在C#中如何使用资源的方法
    C#调用windows API的一些方法
    Uml学习-类图简介
    Uml学习-用例建模简介
    sqlserver中DATE类型的数据转化 CONVERT
    mysql database和schema区别
    nginx buffer
    django pk 和id用法
    sed正则
    kong 插件开发分析
  • 原文地址:https://www.cnblogs.com/Renyi-Fan/p/13958500.html
Copyright © 2011-2022 走看看