zoukankan      html  css  js  c++  java
  • 贝叶斯分类器

    贝叶斯分类是统计学的一个分类方法,基于贝叶斯定理。首先贝叶斯分类的一个核心如果是一个属性值对给定类的影响独立于其它属性的值(类条件独立)


    先来看下条件概率:


    AB是两个事件,且P(B)>0,则称 为在事件B发生的条件下,事件A的条件概率。


    再来看一下贝叶斯定理:


    当中:

    是类标识未知的数据样本(或数据元组)

    如:35岁收入$4000的顾客


    是数据样本X属于某特定类C的某种假定。

    如:如果顾客将购买计算机


    P(H/X):条件XH的后验概率

    如:知道顾客年龄与收入时,顾客将购买计算机的概率


    P(H):H的先验概率,即在我们观察不论什么样本前的初始概率,它反应了背景知识。

    如:随意给定的顾客将购买计算机的概率。


    P(X):被观察的样本数据的概率

    如:顾客中年龄35岁收入$4000的概率


    P(X|H) :条件H下。X的后验概率

    如:已知顾客购买计算机。该顾客为35岁收入$4000的概率

    朴素贝叶斯分类器


    因为PX)对于不论什么一个类别H而言,其值都是固定的,因此在计算PH|X)时不须要考虑。


    上面已经提到了朴素贝叶斯分类的核心如果是X向量中的每个參数xixj之间都是相互独立的(类条件独立)。因此有以下计算P(X|H)的公式:

     

    可将Ci看成为H


    对未知样本X分类,也就是对每一个类Ci。计算p(X|Ci)*p(Ci)


    样本X被指派到类Ci,当且仅当p(Ci|X) > p(Cj|X), 1jm , ji,换言之,X被指派到p(X|Ci) *p(Ci)最大的类。


    有了上面的知识,朴素贝叶斯分类器就变成了简单的概率计算了。基于训练集的数据。事先计算出每一个类别的概率PCi),再计算出每一个类别下每一个參数的概率Pxi|Ci)。当面临一个新样本时,利用上面简化的贝叶斯公式计算出P(Ci|X),值最大的Ci记为分类结果。为了防止出现零概率现象,能够在保存的每一个概率的分子分母都+1


    以下看一个样例:

     


  • 相关阅读:
    phonegap 拍照从相机中获取
    .net 保存datatable保存成csv文件
    常见空间算法【转】
    去除HTML标记 修改p标签为br,修改br为br,保留img标签
    C# access to the path is denied
    phonegap 通过URI获取文件大小
    PowerDesigner 注释 名称【转】
    sql server保存图片
    C#打开自定义文件
    【转】C# AderTemplates 2.0 轻量级模板引擎
  • 原文地址:https://www.cnblogs.com/mengfanrong/p/5230371.html
Copyright © 2011-2022 走看看