zoukankan      html  css  js  c++  java
  • 几大分布函数

    目录

    1、0-1分布(两点分布、伯努利分布)

    2、几何分布

    3、二项分布

    4、高斯分布(正态分布)

    5、卡方分布 (chi-square distribution)

    6、t分布

    • 6.1 置信区间
    • 6.2 例题

    7、泊松分布

    8、指数分布

    9、F分布


    1、0-1分布

    单个二值型离散随机变量的分布,概率分布函数:

    2、几何分布

    离散型概率分布,定义为:n次伯努利试验中,试验k次才能得到一次成功的机率。即前k-1次皆失败,第k次成功的概率。

    概率分布函数:

    3、二项分布

    n次伯努利试验,各次试验之间相互独立,每次试验只有两种可能(抛硬币),相互对立。设事件发生的概率是P,不发生的概率是1-P,n次重复独立试验中发生K次的概率:

    4、高斯分布(正态分布)

    随机变量X服从数学期望为μ,方差为σ2的正态分布,记为N(μ,σ2)。

    μ决定正态分布的位置。

    标准差决定正态分布的幅度。

    性质:

    标准正态分布:μ=0,σ=1。

    性质:

     Φ(x)=1-Φ(-x)

    5、卡方分布 (chi-square distribution)

    若n个相互独立的随机变量ξ₁,ξ₂,...,ξn ,均服从标准正态分布N(0,1)(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。

    随机变量 :

    记为:

    其中参数  称为自由度,自由度不同就是另一个  分布。

    卡方分布是由正态分布构造而成的一个新的分布,当自由度  很大时,  分布近似为正态分布。

    性质:

    6、t分布

    正态分布是许多统计方法的理论基础。μ和σ决定了正态分布的位置和形态。为了应用方便,常将一般的正太变量X通过u变换[(X-μ)/σ]转化成标准正态分布N(0,1),使原来各种形态的正态分布都转换成了μ=0,σ=1的标准正态分布,也称为u分布 。

    根据中心极限定理,通过抽样模拟试验表明,在正态分布总体以固定n抽取若干个样本时,样本均数的分布仍然服从正态分布N(μ,  )。所以对样本均数(均值)的分布进行u变换,也可以变换为标准正态分布。

    实际工作中,σ2(总体方差)是未知的,所以常用s作为σ的估计值,为了与u变换区别,称为t变换。

    统计量t值的分布称为t分布。假设随机变量X服从标准正态分布N(0,1),Y服从 分布,那么  的分布称为自由度为n的t分布,记为 

     

    可以看出t分布以0为中心,左右对称的单峰分布;

    t分布式一簇曲线,形态变化与n(确切的说自由度v)大小有关,自由度越小,t分布越低平;自由度越大,t分布曲线越接近标准正态分布(u分布)。

    6.1 置信区间

    已知X~N(μ,1)找一个区间,使得包含μ的真值的概率为95%,假n=5,则:

    ~ N(μ,  ) ~ N(μ,1/5) 

    α = 1 - 95% = 0.05

    查表得:

    查表的方法:直接在标准正态分布表里面找概率 = 1-α/2 时的 z 取值。

    含义:正态分布左侧的面积(概率)为0.975时候的横坐标值。(上分位)

    Z1-α/2:是下分位表示,意思是右侧面积为0.975。

    注意:置信区间双侧检验,所以要α/2.

    称随机区间为参数μ的置信度为95%的置信区间。

    (1)已知总体方差,求总体均值的置信区间

    是总体样本均值;

    α是显著水平(1-置信度),若置信度是95%,则α=1-0.95=0.05;

    Zα/2称为Z值,可以查找标准正态分布表得到;(z(a/2)指的是标准正态分布的双侧临界值,z(a)当然就是单侧临界值)

    σ:总体的标准差;

    n:抽样出来的样本个数;

    :样本的标准误差

    (2)未知总体方差,求总体均值μ的置信区间

    tα/2(n-1)称为t值,通过查t分布表得到(tα/2(n-1) = t1-α/2(n-1));

    S:样本的标准差

    :样本的平均误差

    6.2 例题

    7、泊松分布

    日常生活中,大量事件是有固定频率的,特点是我们可以预估这些事件的总数,但是没法知道具体的发生时间。比如我们知道平均1小时生3个婴儿,请问下一个小时会出生几个?

    泊松分布就是描述某段时间内,事件具体的发生概率:

    其中,P表示概率,N(t)表示某种函数关系,t是事件,n是数量。一个小时内出生3个婴儿的概率表示为P(N(1)=3),λ表示事件的频率。

    比如接下来两个小时,一个婴儿都不出声的概率为:

    接下来一个小时,至少出生两个婴儿的概率:

    8、指数分布

    事件的时间间隔的概率,无记忆性。

    例如婴儿出生的时间间隔,网站访问的时间间隔。。。。

    指数分布可以从泊松分布推到出来,如果下一个婴儿要间隔时间t,就等同于t内没有任何婴儿出生:

    9、F分布

  • 相关阅读:
    ASP.NET MVC5+ 路由特性
    老李分享:大数据,数据库,数据仓库之间是什么关系
    老李分享:DBA
    老李提问:开源家族你认识几个
    米尔格伦连锁信实验
    老李分享:六度分隔理论
    三者关系
    老李分享:JDK,JRE,JVM区别与联系
    Linux简介与厂商版本下
    Linux简介与厂商版本上
  • 原文地址:https://www.cnblogs.com/pacino12134/p/11374259.html
Copyright © 2011-2022 走看看