zoukankan      html  css  js  c++  java
  • 概率论中PDF、PMF和CDF的区别与联系

    概率论中PDF、PMF和CDF的区别与联系

    一、总结

    一句话总结:

    PDF:概率密度函数(probability density function), 在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。
    PMF:概率质量函数(probability mass function), 在概率论中,概率质量函数是离散随机变量在各特定取值上的概率。
    CDF:累积分布函数 (cumulative distribution function),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。

    1、PDF和PMF区别?

    1、PDF是连续变量特有的,PMF是离散随机变量特有的;
    2、PDF的取值本身不是概率,它是一种趋势(密度)只有对连续随机变量的取值进行积分后才是概率,也就是说对于连续值确定它在某一点的概率是没有意义的;
    3、PMF的取值本身代表该值的概率。

    二、概率论中PDF、PMF和CDF的区别与联系

    转自或参考:概率论中PDF、PMF和CDF的区别与联系_秦刚刚的博客-CSDN博客_pmf
    https://blog.csdn.net/yzcjwddbdgg/article/details/88063677

    在概率论中,经常出现PDF、PMF和CDF,那么这三者有什么区别与联系呢?

    1. 概念解释

    • PDF:概率密度函数(probability density function), 在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。

    • PMF : 概率质量函数(probability mass function), 在概率论中,概率质量函数是离散随机变量在各特定取值上的概率。

    • CDF : 累积分布函数 (cumulative distribution function),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。

    2. 数学表示

    2.1 PDF

    如果XX是连续型随机变量,定义概率密度函数为fX(x)fX(x),用PDF在某一区间上的积分来刻画随机变量落在这个区间中的概率,即

    2.2 PMF

    如果XX离散型随机变量,定义概率质量函数为fX(x)fX(x),PMF其实就是高中所学的离散型随机变量的分布律,即

    比如对于掷一枚均匀硬币,如果正面令X=1X=1,如果反面令X=0X=0,那么它的PMF就是

    2.3 CDF

    不管是什么类型(连续/离散/其他)的随机变量,都可以定义它的累积分布函数,有时简称为分布函数。

    对于连续型随机变量,显然有:


    FX(x)=Pr(X≤x)=∫−∞xfX(t)dtF_X(x)=Pr(Xleq x)=int _{-infty }^{x}f_X(t) dtFX(x)=Pr(Xx)=xfX(t)dt
    那么CDF就是PDF的积分,PDF就是CDF的导数。

    对于离散型随机变量,其CDF是分段函数,比如举例中的掷硬币随机变量,它的CDF为:

    FX(x)=Pr(X≤x){0if   x&lt;012if   0≤x&lt;11if   x≥1F_X(x)=Pr(Xleq x)left{ egin{array}{rcl} 0 &amp; &amp; {if x &lt;0 }\ frac{1}{2} &amp; &amp; {if 0leq x&lt;1}\ 1 &amp; &amp; {if xgeq 1}\ end{array} ight. FX(x)=Pr(Xx)0211if   x<0if   0x<1if   x1

    3.概念分析

    根据上述,我们能得到以下结论:

    • PDF是连续变量特有的,PMF是离散随机变量特有的;
    • PDF的取值本身不是概率,它是一种趋势(密度)只有对连续随机变量的取值进行积分后才是概率,也就是说对于连续值确定它在某一点的概率是没有意义的;
    • PMF的取值本身代表该值的概率。

    4.分布函数的意义

    我们从两点来分析分布函数的意义:

    4.1 为什么需要分布函数?

    对于离散型随机变量,可以直接用分布律来描述其统计规律性;而对于连续型随机变量(非离散型的随机变量),我们无法一一列举出随机变量的所有可能取值,所以它的概率分布不能像离散随机变量那样用分布律进行描述。于是引入PDF,用积分来求随机变量落入某个区间的概率

    分布律(PMF)不能描述连续型随机变量,密度函数(PDF)不能描述离散随机变量,因此需要找到一个统一方式描述随机变量统计规律,这就有了分布函数

    另外,在现实生活中,有时候人们感兴趣的是随机变量落入某个范围内的概率是多少,如掷骰子的数小于3点的获胜,那么考虑随机变量落入某个区间的概率就变得有现实意义了,因此引入分布函数很有必要。

    4.2 分布函数的意义

    分布函数F(x)F(x)F(x)在点xxx处的函数值表示XXX落在区间(−∞,x](−infty,x](,x]内的概率,所以分布函数就是定义域为RRR的一个普通函数,因此我们可以把概率问题转化为函数问题,从而可以利用普通的函数知识来研究概率问题,增大了概率的研究范围。

    5.参考文献

    概率中的PDF,PMF,CDF
    http://www.dataguru.cn/thread-150756-1-1.html
    https://www.zhihu.com/question/23022012
    https://www.zhihu.com/question/36853661
    https://www.zhihu.com/question/21911186
    http://wenku.baidu.com/view/823a0bb9f111f18582d05a14.html

     
    我的旨在学过的东西不再忘记(主要使用艾宾浩斯遗忘曲线算法及其它智能学习复习算法)的偏公益性质的完全免费的编程视频学习网站: fanrenyi.com;有各种前端、后端、算法、大数据、人工智能等课程。
    博主25岁,前端后端算法大数据人工智能都有兴趣。
    大家有啥都可以加博主联系方式(qq404006308,微信fan404006308)互相交流。工作、生活、心境,可以互相启迪。
    聊技术,交朋友,修心境,qq404006308,微信fan404006308
    26岁,真心找女朋友,非诚勿扰,微信fan404006308,qq404006308
    人工智能群:939687837

    作者相关推荐

  • 相关阅读:
    填坑总结:python内存泄漏排查小技巧
    springMVC注解中@RequestMapping中常用参数value params 以及@RequestParam 详解
    springMVC 自定义类型转换器
    为什么Java需要lambda 表达式? 上帝爱吃苹果
    利器| Cypress 强大全新的 Web UI 测试框架应用尝鲜
    缺少锻炼面试的机会?城市群之北上广杭一起来了!
    实战 | 基于JMeter 完成典型电商场景(首页浏览)的性能压测
    一文搞定 pytest 自动化测试框架(一)
    测试面试 | Java 经典面试题汇总
    软件测试工程师成长痛点和职业发展建议
  • 原文地址:https://www.cnblogs.com/Renyi-Fan/p/13205687.html
Copyright © 2011-2022 走看看