zoukankan      html  css  js  c++  java
  • 生成式模型和判别式模型

    总的来说,对于输入X,类别为Y的数据,生成模型是估计他们的连个概率密度P(X,Y),判别式模型为估计条件概率P(Y|X)。

    生成模型:有数据学习联合概率密度P(X,Y),然后求出条件概率P(Y|X)作为预测模型,如贝叶斯、HMM、主题LDA。

    判别模型:由数据直接学习决策函数Y=F(X),如KNN、SVM、LR、boosting。

    如何区分?模型如果是直接根据数据X,直接判定Y的类别的话就是判别模型;间接判定Y的类别的话就是生成模型。

    引用:

    生成模型:以统计学和Bayes作为理论基础

    1、朴素贝叶斯:

    通过学习先验概率分布和条件概率分布,得到联合概率分布,然后对应分类时的后验概率为:

     使用极大似然估计(使用样本中的数据分布来拟合数据的实际分布概率)得到先验概率。

    判别模型

    1、感知机 (线性分类模型)

    输入空间为,输出空间为,使用的映射函数为,其中sign为符号函数 (输入大于等于1时输出为1;否则为0)。使用的损失函数为误分类点到超平面的总距离,即:

    其中M为所有误分类点的集合,||w||可以不考虑。可以使用随机梯度下降得到最后的分类超平面。

  • 相关阅读:
    CentOS中rpm和yum到底有什么区别?
    Anaconda是个什么东东?
    Hadoop入门学习整理(三)
    Hadoop入门学习整理(二)
    CentOS6.10下安装MongoDB和Redis
    Linux 系统中环境变量/etc/profile、/etc/bashrc、~/.bashrc的区别
    一些想法
    时间
    周末
    条件
  • 原文地址:https://www.cnblogs.com/wobushangwangl/p/11460414.html
Copyright © 2011-2022 走看看