朴素贝叶斯是一种简单的概率分类器, 其实是利用了先验概率, 而计算后验概率的一种概率统计方法, 虽然很简单, 但是面对一些问题, 确实很有效
- 基于朴素贝叶斯的分类方法
优点: 在数据量很少的情况下, 仍然有效, 而且可以处理多分类问题
缺点: 对于输入数据的准备方式比较敏感
贝叶斯的理论的核心思想是: 选择具有最高概率的决策
朴素贝叶斯利用了一些简单的思想:
如果知道一些事物的分布, 那么对于每一个分布的实际概率是可以算出来的, 因此我们可以根据先验概率来估算后验概率, 这样就可以对特征进行后验概率的计算, 通过计算, 我们就可以得到归于哪一类的概率大, 因此也就分类完成了, 思想理解了, 但是具体要怎么做呢?
下面是用朴素贝叶斯做一个垃圾邮件的分类器, 我会把每一步尽量标注一下, 方便自己理解