zoukankan      html  css  js  c++  java
  • 贝叶斯分类器(Bayes分类器)

    贝叶斯(Bayes)定理
         (条件概率)
     
    贝叶斯分类器(Bayes分类器)
      1概念:
    • 每个属性类别标记视为随机变量
    • 给定一个具有属性集合(A1, A2,…,An)的记录
    • 目标是预测类别属性C
    • 具体而言,要寻找使得P(C| A1, A2,…,An )最大的类别C。

      2方法:

    • 利用Bayes定理计算所有类别C的后验概率P(C | A1, A2, …, An)
               
            选择使如下概率值最大的类别C :P(C | A1, A2, …, An)
            等价于使如下概率值最大:P(A1, A2, …, An|C) P(C)
     
    朴素贝叶斯分类器(朴素Bayes分类器)
    • l假定给定类别的条件下属性Ai之间是独立的:   
      P(A1, A2, …, An |C) = P(A1| Cj) P(A2| Cj)… P(An| Cj) 
      可以从Ai和Cj中估算出P(Ai| Cj),类别为使P(Cj)P(Ai| Cj)最大的类Cj

        举例

         1、如图所示,已知以下训练集Give Birth,Can Fly,Live in Water,Have Legs的属性,判断所给出测试集是属于(class)哪一类

            

         2、计算

        

         解释:p(A|M)=6/7*6/7*2/7*2/7:  class中属于动物类的有7个在这7个里,其中Give Birth是yes的有6个;Can Fly是no的有6个;Live in Water是yes的有2个;Have Legs是no的有2个。

                 p(A|N)=1/13*10/13*3/13*4/13:  class中属于非动物类的有13个在这13个里,其中Give Birth是yes的有1个;Can Fly是no的有10个;Live in Water是yes的有3个;Have Legs是no的有4个。

                 

                 因为P(A|M)P(M)>P(A|N)P(N),所以测试类为动物

  • 相关阅读:
    32位系统最大只能支持4GB内存之由来
    无线传感器网络中的节点定位技术
    Python 面向对象编程(一)
    Eclipse+PyDev+Django+Mysql搭建Python web开发环境
    Python中的函数(二)
    关于raw_input()和sys.stdin.readline()的区别
    Python中的函数(三)
    将Sublime Text 2搭建成一个好用的IDE
    Windows Phone 7 Tips (1)
    Expression Blend 知识锦分享
  • 原文地址:https://www.cnblogs.com/chamie/p/4450731.html
Copyright © 2011-2022 走看看