事情还没有发生,要求这件事情发生的可能性的大小,是先验概率。比如投色子时,3点的概率为1/6。
事情已经发生,要求这件事情是由某个原因引起的可能性的大小,是后验概率。比如早上起来发现路面是湿的,有可能是前一天晚上下雨了,也有可能是因为洒水车刚经过这里。在观察到路面是湿的条件下,推测下雨和洒水车经过的这两个因素可能发生的概率,这就是后验概率。
在贝叶斯分类问题中,类别$C_i$是因,属性特征$old{x}=(x_1, x_2,..., x_n)$是果。根据各个原因($C_i$),去计算$P(old{x}|C_i)$,是“由因推果”,即计算先验概率。
已知某个测试样本的的属性特征$old{x}$,求这个测试样本属于各类的概率$P(C_i|old{x})$分别为多少,就是求后验概率。可结合这篇博客中的例子进行理解。
贝叶斯分类法的基本思想的是把计算后验概率的问题转化为计算先验概率的问题,如下图所示:
ps: 在李宏毅的教学视频中,$P(C_i)$叫做 prior probability,$P(old{x}|C_i)$叫做class-depencent probability。