zoukankan      html  css  js  c++  java
  • BAYES和朴素BAYES

    0 前言

        朴素贝叶斯算法仍然是流行的十大挖掘算法之一,该算法是有监督的学习算法,解决的是分类问题,如客户是否流失、是否值得投资、信用等级评定等多分类问题。该算法的优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。但由于该算法以自变量之间的独立(条件特征独立)性和连续变量的正态性假设为前提,就会导致算法精度在某种程度上受影响。接下来我们就详细介绍该算法的知识点及实际应用。 本文主要利用贝叶斯对缺失值不敏感这一优点,处理数据。

    1 贝叶斯和朴素贝叶斯

      朴素贝叶斯公式:

     

    从公式中可知,如果要计算X条件下Y发生的概率,只需要计算出:X的概率(P(X)),即X的先验概率、Y属于某类的概率(P(Y)),Y的先验概率、以及已知Y的某个分类下,事件X的概率(P(X|Y)),是后验概率下面详细解释三种概率值。即:

    P(x)指在所有客户集中,某位22岁的本科女性客户,其月收入为7800元,在12次消费中合计支出4000元的概率;

    P(Y)指流失与不流失在所有客户集中的比例;

    P(X|Y)指在已知流失的情况下,一位22岁的本科女性客户,其月收入为7800元,在12次消费中合计支出4000元的概率。

    2 原理实现和编程

      R语言中可以使用bnlearn包来对贝叶斯网络进行建模。但要注意的是,bnlearn包不能处理混合数据,所以先将连续数据进行离散化(因子型),再进行建模训练。

    (我之前犯过这个错误,就是把混合数据直接建模训练,得出结果为空,还茫然不知所措。。。)

    图片来源:https://blog.csdn.net/sinat_26917383/article/details/51569573

    此外还有自助法(bootstrap),交叉验证(cross-validation)和随机模拟(stochastic simulation)等功能,附加的绘图功能需要调用 Rgraphviz and lattice 包。

    3 总结

      

    参考文献

  • 相关阅读:
    js原型对象与Java类的比较
    javascript特效--制作背景电子钟(整点时祝贺生日快乐)
    Java web MVC开发模式入门感悟
    重新审视面向对象编程
    10-排序4 统计工龄(20 分)
    基数排序
    表排序
    快速排序
    09-排序3 Insertion or Heap Sort(25 分)
    09-排序2 Insert or Merge(25 分)
  • 原文地址:https://www.cnblogs.com/babyfei/p/9038735.html
Copyright © 2011-2022 走看看