最大似然估计

zoukankan html css js c++ java

最大似然估计

参考从最大似然到 EM 算法浅解最大似然估计学习总结 EM 算法及其推广学习笔记

之前已经总结了似然的概念，那么顺其自然的理解就是，求得似然最大值的参数即为想要的参数，也就是参数估计，使用的方法为最大似然估计。

先提出几个问题：

1.最大似然估计求参数的一般流程是怎样的？

2.什么样的场景适合/不适合最大似然估计？为什么

求解步骤：

基于对似然函数 L(θ) 形式 (一般为连乘式且各因式 > 0) 的考虑，求θ的最大似然估计的一般步骤如下：

(1) 写出似然函数

　　总体 X 为离散型时：

　　　　

　　总体 X 为连续型时：

　　　　

(2) 对似然函数两边取对数有

　　总体 X 为离散型时：

　　　　

　　总体 X 为连续型时：

　　　　

(3) 对求导数并令之为 0：

　　　　

此方程为对数似然方程。解对数似然方程所得，即为未知参数的最大似然估计值。

总结一下：

极大似然估计，只是一种概率论在统计学的应用，它是参数估计的方法之一。说的是已知某个随机样本满足某种概率分布，但是其中具体的参数不清楚，参数估计就是通过若干次试验，观察其结果，利用结果推出参数的大概值。最大似然估计是建立在这样的思想上：已知某个参数能使这个样本出现的概率最大，我们当然不会再去选择其他小概率的样本，所以干脆就把这个参数作为估计的真实值。

要求θ，只需要使θ的似然函数 L(θ) 极大化，然后极大值对应的θ就是我们的估计。这里就回到了求最值的问题了。怎么求一个函数的最值？当然是求导，然后让导数为 0，那么解这个方程得到的θ就是了（当然，前提是函数 L(θ) 连续可微）。那如果θ是包含多个参数的向量那怎么处理啊？当然是求 L(θ) 对所有参数的偏导数，也就是梯度了，那么 n个未知的参数，就有 n 个方程，方程组的解就是似然函数的极值点了，当然就得到这 n 个参数了。

例子1：　

简单1点：1个参数，1个观察值

继续来看例子，假设进行一个实验，实验次数为 10 次，每次实验成功率为 0.2，那么不成功的概率为 0.8，用
$该式子分为两项因子，10 次实验中有 y 次成功，那么即在 10 次中随意挑选 y 个成功的实验，即C10 y（不好编辑，的意思）；第二项为 10 次实验中，y 次实验成功的概率。更一般地，我们可以把每次实验成功的概率当作一个变量 θ ，则上式可以写为：$
显然，

好了，现在假设我们在实验室，开始完成某个实验，我们并不知道该实验成功的概率是多少，但做了 10 次实验后，我们只成功了 2 次，用高中的概率知识拿来求解，那不就是实验成功率为 0.2。的确，但由于实验次数相当的小，这里的 0.2 并非是真正的概率，而只是我们实验成功的频率。如抛一枚硬币，抛个 10 次，可能正面朝上的频率为 0.6，但我们都知道，实际正面朝上的概率为 0.5。那如何让频率接近 0.5 呢，不断的增加实验次数即可，你抛个 2 万次试试。所以我们不能简单的就把这个问题中求解的 0.2 作为我们的答案，我们也不可能大量重复实验来统计该实验成功率。遇到这种情况，我们便用到了似然估计方法。

似然函数：

现在我们已知实验次数为 2，我们要求

这里没求对数的话，计算很复杂，那求对数呢？会发现计算很方便的。

算出来的答案是一样的，这不是多此一举嘛，但上述实验成功次数背后的参数

复杂一点：1个参数，多个观察值

我们再把上述问题复杂一下，假设我们现在重复上述实验过程，即第一次，重复实验 10 次，观察到实验成功次数为 1 次；第二次，重复实验 10 次，观察实验成功次数为 2 次。问：你能告诉我实验成功的次数为几次吗？还是用数学严格的进行求解一次！

这里我们有两个观察值，即随机变量

同样的，要求

求得

例子2：

多个参数求偏导

设总体 X~N(μ，σ2)，μ，σ为未知参数，X1,X2...,Xn 是来自总体 X 的样本，X1,X2...,Xn 是对应的样本值，求μ与σ2 的最大似然估计值。

这里要注意，两个偏导为0需同时满足，在各自参数的方向上导数都要为0,才是最终的极值点。

第二个问题：

概率模型中当存在隐变量时，就无法直接用极大似然估计法进行求解

3硬币模型，也是之后引入到EM算法的例子

假设有 3 枚硬币，分别记作 A，B，C。这些硬币正面出现的概率分别是

假设只能观测到掷硬币的结果，不能观测掷硬币的过程。也就是只知道最后的结果是正反面，不知道A硬币的结果，也不知道扔的是B还是C硬币，问如何估计三硬币正面出现的概率，即三硬币模型的参数。

同样的，先用先前似然估计方法来求解一波，看看能否给出答案。假设我们知道了一个观测值：

这里y的值取1或0，分别表示正反面。来直接用

该式子中

以极大似然方法进行求解，分别对参数

（遗留一个问题和一个证明，三硬币模型中是由于

感觉这道题里面，π就算已知，比如说是0.5,那么可得P(y|θ)=0.5p+0.5q，分别对p，q求导，都是大于0 的啊。感觉无解，那么问题来了，为什么上面的例子2里，求μ，σ² ，没这个问题，隐藏变量究竟是什么，如何区分和定义。

隐藏变量和参素混淆了，重新理解了一下：

隐藏变量是指无法观测的变量，学生的身高属于正太分布，均值和方差只是参数而已，身高是变量，是可以直接观察的，不属于隐藏变量，而在三硬币模型中，A硬币的状态可以影响到B，C，但是却无法直接观察到，这才是隐藏变量，至于π,p,q，只是三硬币模型的参数。

查看全文

相关阅读:
实验2（第二章课后习题）
weekend及反位数（第一次c++作业）
如何在Vue项目中使用百度地图
 Vue中使用js-pinyin包实现城市按首字母排序
 Webstorm中使用less编写css
关于cookie的使用
 Vue数据双向绑定的实现
 Vue的生命周期
 Vue-cli（Vue脚手架）挂载Element-ui和axios方法
 Vue脚手架学习笔记（一）

原文地址：https://www.cnblogs.com/dahu-daqing/p/8328222.html

最大似然估计

求解步骤：

例子1：

简单1点：1个参数，1个观察值

复杂一点：1个参数，多个观察值

例子2：

例子1：