zoukankan      html  css  js  c++  java
  • 贝叶斯定理推导(Bayes's Theorem)

    这里用文氏图(Venn diagram)来推导一下贝叶斯定理。

    假设A和B为两个不相互独立的事件。

    交集(intersection): 

    上图红色部分即为事件A和事件B的交集。

    并集(union): 

    由Venn diagram可以看出,在事件B已经发生的情况下,事件A发生的概率为事件A和事件B的交集除以事件B:

    同理,在事件A已经发生的情况下,事件B发生的概率为事件A和事件B的交集除以事件A:

    注:表示 A,B 事件同时发生的概率,如果 A 和 B 是相互独立的两个事件,那么:

    由上面的公式可以得到:

    然后,我们就可以得到贝叶斯定理

    其中: 先验概率(prior probability)条件概率(conditional probability)后验概率(posterior probability)联合概率(joint probability),通常写成P(A,B)

    注:条件概率 P(B|A) ---> 给定事件A,事件B发生的概率(probability of event B occuring given event A)。

    又根据Law of Total Probability: 

    注:表示事件A不发生的概率。

    这个可以用probability tree来帮助理解一下:

     

    因此,贝叶斯定理可以扩展为: 

    贝叶斯定理通常用于由已知的先验概率和条件概率,推算出后验概率。

    举一个简单的例子:某地平时下雨的概率是0.3,小明平时带伞的概率是0.4,小明下雨天带伞的概率是0.8。某一天小明带了伞,请问这天下雨的概率是多少?

    解答:也就是需要求P(下雨|小明带伞),把上面的数字代入公式即:

    这个例子的先验概率是平时下雨的概率0.3,由于我们已知小明带了伞这一信息,因此我们可以估算出后验概率,也就是当天下雨的概率是0.6。

    先验概率是怎么得来的呢?通常是人们的经验总结或者说是估算,比如说某地一个月里面下了3天雨,我们就估算某地平时下雨的概率是0.3。

    如果条件不止一个呢?让我们把上面的例子改一下:某地平时下雨的概率是0.3,平时刮风的概率是0.4,下雨天刮风的概率是0.6,小明平时带伞的概率是0.4,小明下雨天带伞的概率是0.8。某一天小明带了伞,且当天在刮风,请问这天下雨的概率是多少?

    解答:也就是需要求P(下雨|小明带伞,刮风),把上面的数字代入公式即:

    注:这里假设小明带伞和刮风之间没有关联,两条件互不影响(条件独立假设),因此属于朴素贝叶斯的范畴。

    长久以来,人们信奉的是频率主义。比如把一枚硬币抛10000次,有5000次正面朝上,5000次反面朝上,那么我们就可以得知抛这枚硬币,其正面朝上的概率是0.5。通常,我们需要某一事件发生足够多的次数,我们才可以观察到它的规律。

    在现实生活中,很多事件并不会在相对较短的时间内多次发生。这时候,贝叶斯定理就发挥作用了。比如说我们想知道刮风天下雨的概率是多少,我们不用等10000个刮风天,看其中有几天下了雨。我们只需要估算出下雨天会刮风的概率,平时下雨的概率,平时刮风的概率,就可以估算出刮风天会下雨的概率是多少了。先验概率估算得不准确并没有关系,人们可以通过未来事件的发生情况,不断对后验概率做出调整。

  • 相关阅读:
    C# 关于替换SQL中某个字段的部分内容
    c# sharepoint client object model 创建工作流历史记录
    c# sharepoint client object model 创建文档库
    c# sharepoint client object model 创建列表库
    C# Windows Server 2016 IIS的安装与配置
    C# 判断当前请求是GET还是POST
    SQL 无法执行脚本
    SharePoint 2013 配置 -- 基于表单的身份认证
    C# 浏览器URL地址殊字符转义编码
    C# Session 只有在配置文件或 Page 指令中将 enableSessionState 设置为 true 时,才能使用会话状态。
  • 原文地址:https://www.cnblogs.com/HuZihu/p/9368355.html
Copyright © 2011-2022 走看看