zoukankan html css js c++ java

机器学习实战笔记-4-朴素贝叶斯

朴素贝叶斯

(计算每类下个特征的条件概率之积和该类概率的乘积)

特点	例
优点：数据较少时依然有效，可处理多类别问题；缺点：对输入数据的准备方式比较敏感；适用数据类型：标称。	文档分类(用关键词) 过滤垃圾邮件(某些关键词是否有侮辱性) 从广告获取区域倾向

原理

如果(pleft( c_{1} middle| x,y ight) >p(c_{2}|x,y))，则(mathbf{x} = (x,y))属于类别(c_{1})，否则属于类别(c_{2})。而由于

[pleft( c_{i} middle| x,y ight) = frac{pleft( x,y middle| c_{i} ight)pleft( c_{i} ight)}{pleft( x,y ight)}]

故比较(pleft( x,y middle| c_{i} ight)pleft( c_{i} ight))即可。其中用到了贝叶斯准则和条件概率的公式。

两个假设：

独立；平等。(特征互相独立，特征同等重要)
(pleft( c_{i} ight) = frac{ ext{num}left( c_{i} ight)}{ ext{NUM}})，(pleft( x,y middle| c_{i} ight) = pleft( xmiddle| c_{i} ight)pleft( y middle| c_{i} ight) =prod_{j}^{}{pleft( frac{ ext{Featur}e_{j}}{c_{i}} ight)})

计算每类下个特征的条件概率之积和该类概率的乘积。

[pleft( ext{Featur}e_{j} middle| c_{i} ight) = frac{p(c_{i} ext{Featur}e_{j})}{p(c_{i})} = frac{num(c_{i} ext{Featur}e_{j})}{num(c_{i})} ]

查看全文

相关阅读:
JS中的钩子(hook)机制与实现
 Java 之注解的定义
 Java 网络编程案例：使用 MulticastSocket 实现多点广播
 Java 基于 UDP 协议的网络编程
 Java 网络编程案例四：多个客户端群聊
 Java 网络编程案例三：多个客户端上传文件
 Java 网络编程案例二：多台客户端与服务器之间的多次通信
 Java 网络编程案例一：一台客户端与服务器单次通信
 Java 之网络常用API
Java 之网络编程基础知识