zoukankan      html  css  js  c++  java
  • B-概率论-常见的概率分布模型


    更新、更全的《机器学习》的更新网站,更有python、go、数据结构与算法、爬虫、人工智能教学等着你:https://www.cnblogs.com/nickchen121/p/11686958.html

    常见的概率分布模型

    一、离散概率分布函数

    离散概率分布也称为概率质量函数(probability mass function),离散概率分布的例子有

    伯努利分布(Bernoulli distribution)

    二项分布(binomial distribution)

    泊松分布(Poisson distribution)

    几何分布(geometric distribution)等

    二、连续概率分布函数

    连续概率分布也称为概率密度函数(probability density function),它们是具有连续取值(例如一条实线上的值)的函数,连续概率分布的例子有

    正态分布(normal distribution)

    指数分布(exponential distribution)

    β分布(beta distribution)等

    三、联合分布函数

    给定一个随机变量(X,Y),称定义域为整个平面的二元实值函数

    F(x,y)=P(Xx,Yy)x,y

    该二元实值函数为随机变量(X,Y)的分布函数,也可以称为是(X,Y)的联合分布函数。

    按照联合分布函数的定义,F(x,y)=P((X,Y)Dxy),其中Dxy如下图所示

    联合分布函数

    四、多项分布(Multinomial Distribution)

    4.1 多项分布简介

    多项分布是二项分布的推广,他们的区别是二项分布的结果只有01两种,多项式的结果可以有多个值。

    多项分布的典型例子是掷骰子,6个点对应6个不同的数,每个点的概率都为16

    与二项分布类似,多项分布来自于(p1+p2++pk)n

    4.2 多项分布公式解析

    以掷骰子为例,掷骰子的时候掷16的概率都为16,记作p1p6,可以发现p1+p2+p3+p4+p5+p6=1,现在把p1+p2+p3+p4+p5+p6记作做一次抽样各种事件发生的概率和,即可得(p1+p2+p3+p4+p5+p6)n=1nn次抽样所有事件相互组合对应的概率和,之后使用多项式展开(注:使用多项式定理展开,由于多项式定理不在本节提及范围内,不多赘述),如果它不是掷骰子,而是一个有n种可能的问题,会得到一个多项式展开的公式

    P(X1=x1,,Xk=xk)={n!x1!xk!(px1pxk)wheni=1kxi=n0otherwise

    这个多项式表示X1出现x1次,X2出现x2次,Xk出现xk次的出现概率,这样就得到了上述所示的多项分布的多项展开式公式。

    五、伯努利分布(Bernoulli Distribution)

    5.1 伯努利分布简介

    伯努利分布是一个二值离散分布,结果只有01两种。

    随即变量X1的概率为p,则为0的概率为q=1p,可以用公式表示为

    f(x)=px(1p)1x={p,x=11p,x=0

    5.2 伯努利分布的期望值和方差

    伯努利分布的期望值为

    (1)E(X)=i=01xif(x)(2)=1p+0(1p)(3)=p+0(4)=p

    伯努利分布的方差为

    (5)D(x)=i=01(xiE(x))2f(x)(6)=(1E(x))2p+(0E(x)2(1p)(7)=(1p)2p+(0p)2(1p)(8)=pp2(9)=p(1p)(10)=pq

    六、正态(高斯)分布(Normal(Gaussian) Distribution)

    6.1 正态分布的概率密度函数图像

    其中红线表示的是标准正态分布图像。

    import numpy as np
    import matplotlib.pyplot as plt
    from scipy import stats
    %matplotlib inline
    

    mu1 = 0
    sig1 = 1
    mu2 = 0
    sig2 = 2

    x = np.arange(-5, 5, 0.1)
    y1 = stats.norm.pdf(x, mu1, sig1)
    y2 = stats.norm.pdf(x, mu2, sig2)
    plt.plot(x, y1, 'r-', label='(mu=0,sigma^2=1)')
    plt.plot(x, y2, 'b-', label='(mu=0,sigma^2=2)')
    plt.legend()
    plt.show()

    png

    6.2 正态分布简介

    正态分布也称作高斯分布,是最常见的一种分布,其概率密度函数为

    f(x;μ,σ)=12πσ2e((xμ)22σ2)

    如果一个随即变量X服从该分布,可以写作X N(μ,σ2)N(μ,σ2)

    μ=0,σ=1时的正态分布称作标准正态分布,这个分布能简化为

    f(x)=12πexp(x22)

    标准正态分布曲线区间面积计算

    f(|xμ|<σ)=0.6826f(|xμ|<2σ)=0.9544f(|xμ|<3σ)=0.9974

    6.3 中心极限定理与正态分布

    1. 中心极限定理1:把许多未知的小作用加起来看作一个变量,这个变量服从正态分布
    2. 中心极限定理2:“大量统计独立的随即变量的和”的分布趋于正态分布

    七、泊松分布(Poisson Distribution)

    7.1 泊松分布的概率质量函数图像

    import numpy as np
    import matplotlib.pyplot as plt
    from scipy import stats
    %matplotlib inline
    

    lambd = 2.5

    x = np.arange(0, 10)
    y = stats.poisson.pmf(x, lambd)
    plt.plot(x, y, label='(lambda=2.5)')
    plt.legend()
    plt.show()

    png

    八、二项分布(Binomial Distributio)

    8.1 二项分布的概率质量函数图像

    import numpy as np
    import matplotlib.pyplot as plt
    from scipy import stats
    %matplotlib inline
    

    n = 8
    p = 0.4

    x = np.arange(0, 20)
    y = stats.binom.pmf(x, n, p)
    plt.plot(x, y, 'o-', label='(n=8,p=0.4)')
    plt.legend()
    plt.show()

    png

    8.2 二项分布简介

    二项分布是n次独立的二值实验(伯努利实验)中成功的次数的离散值概率分布(n次伯努利实验,一次伯努利实验得到一个伯努利分布)。

    随机变量X服从参数np的二项分布记作:B(n,p)n次实验中k次成功的概率质量函数为

    f(k;n,p)=Cnkpk(1p)nk

    其中Cnk是二项式系数:Cnk=n!k!(nk)!

    二项分布来源于牛顿二项式

    (a+b)n=k=0nCnkakbnk

    8.3 二项分布与伯努利分布

    1. 二项分布的期望是伯努利分布期望的n

    E(x)=np

    1. 二项分布的方差是伯努利分布方差的n

    D(x)=np(1p)

    九、贝塔分布(Beta Distribution)

    9.1 贝塔分布的概率密度函数图像

    from scipy import stats
    import matplotlib.pyplot as plt
    import numpy as np
    %matplotlib inline
    

    a = 0.4
    b = 0.6

    x = np.arange(0.01, 1, 0.01)
    y = stats.beta.pdf(x, a, b)
    plt.plot(x, y, label='a=0.4,b=0.6')
    plt.show()

    png

    十、几何分布(负二项分布)(Geometric Distribution)

    10.1 几何分布概率质量函数图像

    十一、狄利克雷分布(多项分布的共轭分布)(Dirichlet distribution)

    十二、超几何分布(Hypergeometric Distribution)

    十三、指数分布(Exponential Distribution)

    13.1 指数分布概率密度函数图像

    import numpy as np
    import matplotlib.pyplot as plt
    from scipy import stats
    %matplotlib inline
    

    lambd = 0.6

    x = np.arange(0, 10, 0.1)
    y = lambd * np.exp(-lambd*x)
    plt.plot(x, y, label='(lambda=0.6)')
    plt.legend()
    plt.show()

    png

  • 相关阅读:
    HTTPS之acme.sh申请证书
    GoAccess日志分析工具
    KVM之CPU虚拟化
    自动化运维之PSSH
    Hadoop+HBase 集群搭建
    SSH + Google Authenticator 安全加固
    查看数据的类型(python)
    在word中,替换多个词语。正则表达式中 [] {} 是可以连用的(python)
    方差分析的前提,与检验,以及球形检验
    清屏处理(汇编)
  • 原文地址:https://www.cnblogs.com/abdm-989/p/14118008.html
Copyright © 2011-2022 走看看