一、简介
贝叶斯用于描述两个条件概率之间的关系,一般,P(A|B)与P(B|A)的结果是不一样的,贝叶斯则是描述P(A|B)和P(B|A)之间的特定的关系。
公式:
[P({A_{
m{i}}}|B) = frac{{P(B|{A_{
m{i}}})P({A_i})}}{{sumlimits_{i = 1}^n {P(B|{A_i})P({A_{
m{i}}})} }}]
注:[{A_1},...,{A_n}]是完备事件组,[ cup _{i = 1}^n{A_i} = Omega ,{A_i}{A_j} = emptyset ,P({A_i}) > 0]
二、统计学中的应用
贝叶斯分类算法是统计学的一种分类方法
1、朴素贝叶斯(Navie Bayes,NB)
成立前提:各属性之间相互独立,即可以满足完备事件组。
情景:设每个数据样本用一个n维特征向量来描述n个属性的值,即:X={x1,x2,…,xn},假定有m个类,分别用C1, C2,…,Cm表示。给定一个未知的数据样本X(即没有类标号),若朴素贝叶斯分类法将未知的样本X分配给类Ci,则一定是P(Ci|X)>P(Cj|X) 1≤j≤m,j≠i
由于P(X)对于所有的属性来说,P(X)都是一样的,即是一个常数(已知),所以[P({C_i}|X) propto P(X|{C_i})P({C_{ m{i}}})]
所谓贝叶斯公式,是指当分析样本大到接近总体数时,样本中事件发生的概率将接近于总体中事件发生的概率.
2、TAN算法(Tree Augmented Bayes Network)
TAN算法通过发现属性对之间的依赖关系来降低NB中任意属性之间独立的假设。它是在NB网络结构的基础上增加属性对之间的关联(边)来实现的.
参考:https://blog.csdn.net/qq_26562641/article/details/50343501