条件概率(英语:conditional probability)就是事件A在事件B发生的条件下发生的概率。
条件概率表示为P(A|B),读作“A在B发生的条件下发生的概率”。
联合概率表示两个事件共同发生的概率。
A与B的联合概率表示为 ({displaystyle P(Acap B)} P(Acap B))或者 ({displaystyle P(A,B)} P(A,B))或者 ({displaystyle P(AB)} {displaystyle P(AB)})。
边缘概率是某个事件发生的概率。
边缘概率是这样得到的:在联合概率中,把最终结果中不需要的那些事件合并成其事件的全概率而消失(对离散随机变量用求和得全概率,对连续随机变量用积分得全概率)。这称为边缘化(marginalization)。A的边缘概率表示为P(A),B的边缘概率表示为P(B)。
需要注意的是,在这些定义中A与B之间不一定有因果或者时间序列关系。A可能会先于B发生,也可能相反,也可能二者同时发生。A可能会导致B的发生,也可能相反,也可能二者之间根本就没有因果关系。
贝叶斯定理是关于随机事件A和B的条件概率的一则定理。
其中P(A|B)是指在事件B发生的情况下事件A发生的概率。
在贝叶斯定理中,每个名词都有约定俗成的名称:
- P(A|B)是已知B发生后A的条件概率,也由于得自B的取值而被称作A的后验概率。
- P(A)是A的先验概率(或边缘概率)。之所以称为"先验"是因为它不考虑任何B方面的因素。
- P(B|A)是已知A发生后B的条件概率,也由于得自A的取值而被称作B的后验概率。
- P(B)是B的先验概率或边缘概率。
按这些术语,贝叶斯定理可表述为:
- 后验概率 = (似然性*先验概率)/标准化常量
- 也就是说,后验概率与先验概率和相似度的乘积成正比。
另外,比例P(B|A)/P(B)也有时被称作标准似然度(standardised likelihood),贝叶斯定理可表述为:
- 后验概率 = 标准似然度*先验概率
练习
大年三十晚上,爷爷奶奶发红包。爷爷准备的红包是 4 个 50 元的,6 个 100 元的。奶奶准备的红包是 8 个 50 元的,4 个 100 元的。全家人随机抽,你运气很好,拿到一个 100 元的红包。请问这个红包来自爷爷的概率有多少?来自奶奶的概率有多少?
随机变量 X 的取值:爷爷、奶奶,随机变量 Y 的取值:50 、100。 问题:求解 P(X=爷爷|Y=100) 、P(X=奶奶|Y=100) 。由统计数据可知:
P(Y=100) = (6 + 4) / (4 + 6 + 8 + 4) = 5/11
P(X=爷爷, Y=100) = 6 / (4 + 6 + 8 + 4) = 3/11
P(X=奶奶, Y=100) = 4 / (4 + 6 + 8 + 4) = 2/11则:
P(X=爷爷|Y=100) = P(X=爷爷, Y=100) / P(Y=100) = 3/5
P(X=奶奶|Y=100) = P(X=奶奶, Y=100) / P(Y=100) = 2/5