前提假设:不要管什么瓜熟的概率,只care瓜熟与蒂落的关系。
1、先验概率
先于结果,确定原因的概率分布,p(行为)
对于爱吃瓜的人来讲,可以根据常识和经验(瓜蒂)就知道西瓜的成熟情况
2、后验概率
先知道结果,由结果估计原因的概率分布,p(产生这样结果的行为|结果)
如果已经知道瓜蒂脱落,那么瓜熟的概率是多少。后验和先验的关系可以通过贝叶斯公式来求。也就是:
P(瓜熟 | 已知蒂落)=P(瓜熟)×P(蒂落 | 瓜熟)/ P(蒂落)
3、似然函数
先确定行为方式,根据行为来估计结果的概率分布,p(结果|行为)
是根据已知结果去推测固有性质的可能性(likelihood),是对固有性质的拟合程度,所以不能称为概率。在这里就是说,如果蒂落了,那么对瓜熟这一属性的拟合程度有多大。似然函数,一般写成L(瓜熟 | 已知蒂落),和后验概率非常像,区别在于似然函数把瓜熟看成一个肯定存在的属性,而后验概率把瓜熟看成一个随机变量。
4、条件概率与似然函数
似然函数就是条件概率的逆反。意为:
L(瓜熟 | 已知蒂落)= C × P(蒂落 | 瓜熟),C是常数。具体来说,现在有1000个瓜熟了,落了800个,那条件概率是0.8。那我也可以说,这1000个瓜都熟的可能性是0.8C。
注意,之所以加个常数项,是因为似然函数的具体值没有意义,只有看它的相对大小或者两个似然值的比率才有意义,后面还有例子。
后验分布 正比于 先验分布 × 似然函数。先验就是设定一种情形,似然就是看这种情形下发生的可能性,两者合起来就是后验的概率。
参考链接
https://www.zhihu.com/question/24261751