zoukankan      html  css  js  c++  java
  • 朴素贝叶斯法(一)——贝叶斯定理

    最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型(Naive Bayesian ModelNBC)。

    贝叶斯定理250多年前发明的算法,在信息领域内有着无与伦比的地位。贝叶斯分类是一系列分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。朴素贝叶斯算法(Naive Bayesian) 是其中应用最为广泛的分类算法之一。

     

    贝叶斯定理

    描述

    贝叶斯定理是关于随机事件AB条件概率的一则定理。

    clip_image001

    在贝叶斯定理中,每个名词都有约定俗成的名称:

    按这些术语,Bayes定理可表述为:

    后验概率 = (相似度*先验概率) / 标准化常量

    P(B|A)称为“可能性函数,这是个调整因子,使得预估计概率更接近真实概率。

    所以,条件概率可以理解为式子:

           后验概率 = 先验概率 * 调整因子

    这就是贝叶斯推断的含义:我们先预测一个先验概率,然后加入实验结果,看这个实验到底是增强还是削弱了先验概率,由此得到更加真实的后验概率

    在这里,如果可能性函数”P(B|A)>1,意味着先验概率被增强,事件A发生的可能性增大;如果可能性函数”P(B|A)=1,意味着事件B无助于判断事件A的可能性;如果可能性函数”P(B|A)<1,意味着先验概率被减弱,事件A发生的可能性变小。

    推导

    根据条件概率的定义。在事件B发生的条件下事件A发生的概率是

    clip_image002

    同样地,在事件A发生的条件下事件B发生的概率

    clip_image003

    整理与合并这两个方程式,我们可以找到

    clip_image004

    这个引理有时称作概率乘法规则。上式两边同除以P(B),若P(B)是非零的,我们可以得到贝叶斯定理:

    clip_image005

    贝叶斯定理通常可以再写成下面的形式:

    clip_image006

    其中ACA补集。故上式亦可写成:

    clip_image007

    在更一般化的情况,假设{Ai}是事件集合里的部分集合,对于任意的Ai,贝叶斯定理可用下式表示:

    clip_image008

    案例

    clip_image009clip_image010clip_image011clip_image012clip_image013clip_image014                   30                                                                                                                                               20     

    clip_image015clip_image016                   10                                                                                                                                               20

                                                                                                                                                           

     

    暗箱操作,现在从其中一个箱子中得到一个绿球,问是从黑箱中取得的概率是?

    分析:假定“从黑箱中取球为事件A,“从红箱中取球为事件B,“取到绿球为事件M.

    则问题为求P(A|M)

    由贝叶斯定理得:P(A|M) = P(A) * P(M|A) / P(M)

    = P(A) * P(M|A) /[ P(M|A)*P(A) + P(M|B) *P(B)]

    其中,P(A)=P(B) = 1/2, P(M|A) = 3/4, P(M|B) = 1/2

    结果为0.6,表明,来自黑箱的概率为0.6。也就是得到绿球后,事件A(取自于黑箱)的可能性增强了。

     

  • 相关阅读:
    不同指针类型的转换
    dt7.0百度熊掌当天主动推送方法
    腾讯视频信息数据爬虫开发【核心爬虫代码】
    seo与python大数据结合给文本分词并提取高频词
    Python经典算法-猴子吃桃-思路分析
    猜数游戏-人机对战-经典的randint使用
    python模拟双色球大乐透生成算法
    python打造批量关键词排名查询工具
    python开发全自动网站链接主动提交百度工具
    centos下shell脚本kill掉mysql锁表进程【笔记】
  • 原文地址:https://www.cnblogs.com/kaituorensheng/p/3372145.html
Copyright © 2011-2022 走看看