zoukankan      html  css  js  c++  java
  • 极大似然估计理解与应用

    1. 什么是极大似然估计

      在日常生活中,我们很容易无意中就使用到极大似然估计的思想,只是我们并不知道极大似然估计在数学中的如何确定以及推导的。下面我们使用两个例子让大家大概了解一下什么是极大似然估计

    (1)猎人师傅和徒弟一同去打猎,遇到一只兔子,师傅和徒弟同时放枪,兔子被击中一枪,那么是师傅打中的,还是徒弟打中的?
    (2)一个袋子中总共有黑白两种颜色100个球,其中一种颜色90个,随机取出一个球,发现是黑球。那么是黑色球90个?还是白色球90个?

      对于第(1)个问题,由于师傅的技术一般比徒弟高,因此我们会猜测兔子是师傅打中的。对于第(2)个问题,对于颜色有90个的球,我们抽中它的概率更大,因此当抽中为黑色球时,我们便会认为90个的是黑色球。
      对于以上两个例子可以看出,我们在进行猜测时,往往认为:概率最大的事件,最可能发生因此在一次试验中就出现的事件应当具有较大的概率。


    2. 极大似然原理及数学表示

      极大似然原理是指:若一次试验有 $ n $ 个可能结果 $ A_1, A_2,...,A_n $ ,现在我们做一次试验,试验的结果为 $ A_i $ ,那么我们就可以认为事件 $ A_i $ 在这个 $ n $ 个可能结果中出现的概率最大。
      极大似然估计是指:在一次抽样中,样本出现的概率是关于参数 $ heta $ 的函数,若在一些试验中,得到观测值 $ x_1,x_2,...,x_n $ ,则我们可以选取 $ hat{ heta}(x_1,x_2,..,x_n) $ 作为 $ heta $ 的估计值,使得当 $ heta = hat{ heta}(x_1,x_2,..,x_n) $ 时,样本出现的概率最大。而极大似然估计就是要求解出参数 $ heta $ 的估计值。可采用极大似然估计法


    3. 极大似然估计法(Maximum Likelihood Estimation,MLE)

      (1)若总体 $ X $ 为离散型
        假设分布律为 $ P lbrace X=x brace = p(x; heta) $ ,$ heta $ 为待估计参数,$ p(x; heta) $ 表示估计参数为 $ heta $ 时,发生 $ x $ 的概率。
        那么当样本值为: $ x_1,x_2,...,x_n $ 时, $$ L( heta) = L(x_1,x_2,...,x_n; heta) = prod_{i=1}^n p(x_i; heta) $$
        其中 $ L( heta) $ 称为样本的似然函数。
        若满足: $$ L(x_1,x_2,...,x_n;hat{ heta}) = max_{ heta}L(x_1,x_2,...,x_n; heta) $$
        也就是说,当参数 $ heta = hat{ heta} $ 时,似然函数可以取最大值,那么 $ hat{ heta} $ 就叫做参数 $ heta $ 的极大似然估计值。
      (2)若总体 $ X $ 为连续型
        假设概率密度为 $ f (x; heta) $ ,$ heta $ 为待估计参数。
        那么当样本值为: $ x_1,x_2,...,x_n $ 时, $$ L( heta) = L(x_1,x_2,...,x_n; heta) = prod_{i=1}^n f(x_i; heta) $$
        其中 $ L( heta) $ 称为样本的似然函数。
        若满足: $$ L(x_1,x_2,...,x_n;hat{ heta}) = max_{ heta}L(x_1,x_2,...,x_n; heta) $$
        也就是说,当参数 $ heta = hat{ heta} $ 时,似然函数可以取最大值,那么 $ hat{ heta} $ 就叫做参数 $ heta $ 的极大似然估计值。


    4. 极大似然估计法求估计值的步骤:

      (1)构造似然函数 $ L( heta) $ :
         $ L( heta) =prod_{i=1}^n p(x_i; heta) (离散型) ; L( heta)=prod_{i=1}^n f(x_i; heta) (连续型) $
      (2)取对数: $ log L( heta) $ (以 $ e $ 为底);
      (3)令 $ frac{delta log L( heta)}{delta heta} = 0 $ ;
      (4)解似然方程得到 $ heta $ 的极大似然估计值 $ hat{ heta} $ 。


    5. 极大似然估计法应用

      (1)假设一个袋子装有白球与红球,比例未知,现在抽取10次(每次抽完都放回,保证事件独立性),假设抽到了7次白球和3次红球,在此数据样本条件下,可以采用最大似然估计法求解袋子中白球的比例。
        求解过程:
        该试验属于二项分布,我们定义 $ M $ 为模型,抽到白球的概率为 $ heta $ ,而抽到红球的概率为 $ 1- heta $ ,因此10次抽取抽到白球7次红球3次的概率(似然函数)为: $$ L( heta) = egin{pmatrix} 10 7 end{pmatrix} P(x_1,x_2,...,x_{10}|M) = egin{pmatrix} 10 7 end{pmatrix} P(x_1|M) imes P(x_2|M) imes ... imes P(x_{10}|M) = egin{pmatrix} 10 7 end{pmatrix} heta^7(1- heta)^3 $$
        其对数似然函数为: $$ log L( heta) = log [ egin{pmatrix} 10 7 end{pmatrix} heta^7(1- heta)^3 ] $$
        求 $$ frac{delta log L( heta)}{delta heta} = 0 $$
        即 $$ 7 heta^6(1- heta)^3 - 3 heta^7(1- heta)^2 = 0 implies heta = 0.7 $$ ,
        二项式系数为常数,在求导过程中会被抵消
        故白球的比例为 $ 0.7 $ 。
      (2)设总体 $ X ~ N(mu, sigma^2) $ ,$ mu, sigma^2 $ 为未知参数,$ x_1,x_2,...,x_n $ 是来自 $ X $ 的一个样本值,求 $ mu, sigma^2 $ 的极大似然估计值。
        求解过程:
         X的概率密度为: $$ f(x;mu,sigma^2)=frac{1}{sqrt{2pi}sigma} e^{-frac{(x-mu)^2}{2sigma^2}} $$
         似然函数为: $$ L(mu,sigma^2) = prod_{i=1}^n frac{1}{sqrt{2pi}sigma} e^{-frac{(x_i-mu)^2}{2sigma^2}} $$
         取对数为: $$ log L(mu,sigma^2) = -frac{n}{2} log (2pi) - frac{n}{2} log sigma^2 - frac{1}{2sigma^2} sum_{i=1}^n(x_i-mu)^2 $$
         令 $$ egin{cases} frac{delta}{delta mu} log L(mu,sigma^2) = 0 frac{delta}{delta sigma^2} log L(mu,sigma^2) = 0 end{cases} $$
         即 $$ egin{cases} frac{1}{sigma^2}[sum_{i=1}^n x_i - n mu] = 0 - frac{n}{2 sigma^2}+ frac{1}{2(sigma^2)^2} sum_{i=1}^n (x_i-mu)^2 = 0 end{cases} $$
        求得参数估计值为: $$ egin{cases} hat{mu} = frac{1}{n} sum_{i=1}^n x_i =overline{x} hat{sigma}^2 = frac{1}{n}sum_{i=1}^n(x_i-overline{x})^2 end{cases} $$


    引用及参考:
    [1] https://www.jianshu.com/p/f1d3906e4a3e
    [2] https://blog.csdn.net/zengxiantao1994/article/details/72787849
    [3] https://wenku.baidu.com/view/0d9af6aa172ded630b1cb69a.html
    [4] https://www.cnblogs.com/xing901022/p/8418894.html

    写在最后:本文参考以上资料进行整合与总结,属于原创,文章中可能出现理解不当的地方,若有所见解或异议可在下方评论,谢谢!
    若需转载请注明https://www.cnblogs.com/lliuye/p/9139032.html

  • 相关阅读:
    07月26日总结
    07月25日总结
    07月24日总结
    07月23日总结
    07月22日总结
    07月20日总结
    07月19日总结
    spinlock in c++11 based on atomic_flag std::memory_order_acquire
    c++ nullptr
    C++11 新特性: unordered_map 与 map 的对比
  • 原文地址:https://www.cnblogs.com/lliuye/p/9139032.html
Copyright © 2011-2022 走看看