zoukankan      html  css  js  c++  java
  • 机器学习面试题001:生成模型与判别模型

    目录

      两者所属范畴

      生成模型定义

      为什么叫生成模型?

      判别模型定义

      一个例子通俗解释两者

      判别模型 VS 生成模型优缺点

      参考资料


    两者所属范畴

     

     返回目录

    生成模型定义

    生成方法由数据可以学习到一个联合概率分布P(X,Y),然后通过一定方式,就可以转为一个预测模型,即生成模型:

      

     典型的生成模型有:朴素贝叶斯模型(NB)和隐马尔科夫模型(HMM)。

    下面解释为什么NB模型是生成模型:

    ■ 由朴素贝叶斯法的定义可知:朴素贝叶斯法是通过训练数据集学习联合概率分布P(X,Y)的。

    ■ 根据乘法公式可知,为了求P(X,Y)可以利用训练数据学习P(X|Y)和P(Y)。

    ■ 得到联合概率分布P(X,Y)后,利用贝叶斯定理,便可得到一个预测模型,即

     

    那HMM模型呢?

    HMM模型是关于时序的概率模型,描述由一个隐藏的马尔科夫链随机生成不可观测的状态序列X,再由各个状态随机生成一个可观测的观测序列Y的过程。X和Y就是由一个联合概率分布P(X,Y)产生的(回忆HMM模型,,先由π产生X1,再根据X1由B产生Y1,然后根据X1由A产生X2,最后根据X2由B产生Y2,以此类推),该联合概率分布就是HMM模型。

     返回目录

    为什么叫生成模型?

     从朴素贝叶斯模型和HMM模型可以看出,这两种模型都含有一种本领:可以表示出数据和标签共同出现的概率。因为他们中都有联合概率分布P(X,Y),那就拥有了生成一组新的数据的能力,这个也就是名称中的生成式模型的来源。

    当然,生成模型也可以做判别(预测),上一节已经阐述。顺便再说一句,判别模型只能做判别,不能生成数据。

     返回目录

    判别模型定义

    判别模型比较简单,就是由数据直接学习决策函数f(X)比如决策树,KNN等,或者直接学习条件概率分布P(Y|X),比如逻辑回归、感知机等。

    典型的判别模型有:KNN、感知机、决策树、逻辑回归、最大熵模型、SVM、提升方法和CRF等。

     返回目录

    一个例子通俗解释两者

      

    假设在一个大学里,有男有女,并且不同性别的人都有自己的穿衣打扮的风格。

     ■ 当有一个【长头发,穿短裙】的人过来的时候,生成模型和判别模型都可以对这个人的性别进行预测,并且大概率这两个模型都会将这个人预测为【女性】。这就说明了生成模型和判别模型都可以做判别(预测)。

     ■ 假设每一个人都是一个数据,如果想按照大学原本的分布增加一些学生的时候,生成模型可以做到,因为他深谙该大学里男女比例以及他们穿衣打扮的信息;而判别模型做不到。这就说明了生成模型掌握着整体数据的分布。  

     返回目录

    判别模型 VS 生成模型优缺点

    ■ 生成模型可以还原出联合概率分布,而判别模型不能。

    ■ 生成模型收敛速度更快。

    ■ 当存在隐变量时,可以使用生成模型,不能使用判别模型。

    ■ 生成模型在做预测的时候准确率往往较低,李航老师给出的解释是

     

    这里从另一个角度定性来分析可以这样解释(以朴素贝叶斯为例):

    $$[sqrt {{a^2} + {b^2}} ]$$

    $$[a + b = 3]$$

    可以看到,相对于条件概率,在计算联合概率的时候引入了输入数据的概率分布P(X),而这并不是我们关心的(我们只关心给定X的情况下Y的分布),于是这个就相对削弱了模型的预测能力。

    返回目录

    参考资料

    《统计学习方法》李航

    《深入浅出PyTorch:从模型到源码》张校捷

     返回目录

  • 相关阅读:
    软件开发人员的简历项目经验怎么写?
    mapreduce 多种输入
    lnmp如何实现伪静态,默认目录伪静态
    LNMP环境中WordPress程序伪静态解决方案
    wordpress必装的插件 wp最常用的十个插件
    debian系统下改语言设置
    Centos7 开启端口
    EventProcessor与WorkPool用法--可处理多消费者
    Disruptor入门
    Disruptor初级入门
  • 原文地址:https://www.cnblogs.com/itmorn/p/13199148.html
Copyright © 2011-2022 走看看