zoukankan      html  css  js  c++  java
  • 计算统计Chap6 推断统计的蒙特卡罗方法 (3)蒙特卡罗方法

    很多时候,我们不清楚统计量的分布,或不确定对它所作的假设是否合理。蒙特卡罗模拟可以处理这些情况,它的应用包括:

    1)当待检测统计量(the test statistics)从未知时,进行推断

    2)当参数假设(parametric assumptions),评估推断方法的性能

    3)在各种情况下进行假设检验

    4)比较不同检测子(estimator)的质量

    1.基本蒙特卡罗过程

    用于推断统计的蒙特卡罗模拟的根本思想是:统计量的特征可通过从相同总体中重复抽样,并观察统计量在这些样本上的表现来获得。

    第一步是决定一个伪总体(pseudo-population),假设它可以表达真实总体。这里“伪”是为了强调样本是利用计算机和伪随机数生成的。同时,这里讨论的蒙特卡罗模拟类型都是参数化的技术,应为都是从已知的或假设的分布中抽样。具体步骤:

    1)确定伪总体,或可表达真实分布的模型

    2)从伪总体中抽样

    3)计算统计量的值

    4)重复2、3,进行M次实验

    5)利用4中获得的M个统计量值来研究统计量的分布

    需要注意的是:从伪总体中抽样时,要保证所有相关特征反映同样的统计状况。例如,相同的样本大小和抽样策略。这意味着,通过此方法获得的统计量分布仅对此抽样过程和伪总体假设有效。

    最后一步就是利用对统计量分布的估计来研究感兴趣的统计特征。如估计偏度、峰度、标准差等。

    2.蒙特卡罗假设检验

    在统计假设检验中,利用检验统计量null hypothesis应该被拒绝或接受的信度。当观测到检验统计量的值后,需要通过判断这个值是否与null hypothesis一致。估计检验统计量在null hypothesis下的分布是蒙特卡罗假设检验的目标之一

    回顾假设检验的critical value approach:首先给定置信水平(significance level)a;然后利用此a找到在null hypothesis为真下检验统计量分布上的置信区间(critical region)。而在蒙特卡罗方法中,我们利用假设统计量的估计分布来确定置信值的,步骤如下:

    1)利用总体的大小为n的随机样本(这时实际观测的数据),计算检验统计量的观测值image

    2)确定一个能反映null hypothesis为真下真实总体特征的伪总体

    3)从伪总体中抽样n次,形成大小为n的随机样本

    4)利用3中的随机样本,计算检验统计量的值

    5)重复3和4共M次,获得值image ,它们就是对null hypothesis为真条件下的检验统计量分布的估计

    6)获得对于给定置信水平a下的critical value

        Lower Tail Test: get the a-th sample quantile, image, from theimage.
        Upper Tail Test: get the (1-a)-th sample quantile, image , from theimage.
        Two-Tail Test: get the sample quantiles image and image from theimage.

    7)若image落入判决区间,则拒绝null hypothesis

    例:关于总体均值的假设检验。数据mcdata有25条记录;null and alternative hypotheses为:image ;检验统计量为image 。分析过程如下:

    1)计算检验统计量的观测值image

    2)确定image 的正态分布为伪总体的分布模型(即null hypothesis为真条件下的检验统计量的分布)。通过绘制下面的qq图,从而验证此模型的合理性。

        image

    3)重复1000次实验。每此都从null hypothesis(正态分布image )为真条件下的检验统计量分布抽样,并计算检验统计量的值,Tm中保存了检验统计量的估计分布

    M = 1000;% Number of Monte Carlo trials
    % Storage for test statistics from the MC trials.
    Tm = zeros(1,M);
    % Start the simulation.
    for i = 1:M
      % Generate a random sample under H_0
      % where n is the sample size.
      xs = sigma*randn(1,n) + 454;
      Tm(i) = (mean(xs) - 454)/sigxbar;
    end
    4)估计lower tail的critical value,得到它为image 

    % Get the critical value for alpha.
    % This is a lower-tail test, so it is the
    % alpha quantile.
    alpha = 0.05;
    cv = csquantiles(Tm,alpha);

    5)因为检验统计量的观测值image小于估计的cirital value(image),从而拒绝image

  • 相关阅读:
    产品经理应该知道的那点事儿(1)
    C语言的前世今生
    “隔代教育的成功之道”新浪教育专家宋少卫做客西单图书大厦
    【9.21更新】跟踪报道TopLanguage关于《深入理解计算机系统(第2版)》一书翻译问题 的讨论
    中国要做物联网技术的强国,而非大国
    关于时钟芯片DS1302的问题
    stm32开发问题集锦
    keil 中使用c++的注意事项
    iar atof 问题
    IAR生成HEX文件
  • 原文地址:https://www.cnblogs.com/pegasus/p/1936580.html
Copyright © 2011-2022 走看看