zoukankan      html  css  js  c++  java
  • 主动学习、纯半监督学习、直推学习的联系与区别

      最近在学习半监督学习方面的内容,一开始便遇到了这么几个概念:主动学习(active learning)、半监督学习(semi-supervised learning)和直推学习(transductive learning)。想必刚开始大家都觉得有点迷糊,下面就让我来详细把它们之间的联系与区别讲述一下,相信读完大家一定会思路清晰,至少在概念上不会再搞错了。

      什么是主动学习?

      主动学习指的是这样一种学习方法:有的时候,有类标的数据比较稀少而没有类标的数据是相当丰富的,但是对数据进行人工标注又非常昂贵,这时候,学习算法可以主动地提出一些标注请求,将一些经过筛选的数据提交给专家进行标注。这个筛选过程也就是主动学习主要研究的地方了。

      什么是半监督学习?

      半监督学习特指的是学习算法不需要人工干预,基于自身对未标记数据加以利用,来提高学习模型的泛化性能。

      一般认为半监督学习包含纯半监督学习直推学习

      三者的联系:

      主动学习、纯半监督学习、直推学习都属于利用未标记数据的学习技术,只是其基本思想不同。

          它们的区别:

      主动学习与半监督学习的区别:

      主动学习的主动指的是主动提出标注请求,也就是说还需要一个外在的能够对其进行标注的实体(通常是相关人员),即主动学习是交互进行的。其目标是使用尽量少的“查询”(query)来获得尽量好的性能。主动学习引入了额外的专家知识,用过与外界的交互来将部分未标记样本转变为有标记样本。

      纯半监督学习与直推学习的区别:

      假设有如下的数据集,其中训练集为XL+XU,测试集为Xtest,标记样本数目为L,未标记样本数目为U,L<<U

    • 标记样本(XL,YL)={(x1:L,y1:L)}  
    • 未标记样本XU={xL+1:N},训练时可用
    • 测试样本Xtest={xN+1:},只有在测试时才可以看到

      纯半监督学习是一种归纳学习(inductive learning),可以对测试样本Xtest进行预测。也即纯半监督学习是基于“开放世界”的假设。

      直推学习是transductive学习,仅仅可以对未标记样本XU进行标记,模型不具备对测试样本Xtest进行泛化的能力。直推学习是基于“封闭世界”的假设。

      直推学习假设未标记的数据就是最终要用来测试的数据,学习的目的就是在这些数据上取得最佳泛化能力。相对应的,纯半监督学习在学习时并不知道最终的测试用例是什么。

    ---------------------------------

      参考:1.机器学习西瓜书 周志华著

                   2.Active Learning Poll的笔记

         3.半监督学习和直推学习

          

  • 相关阅读:
    Struts2+Jquery实现ajax并返回json类型数据
    送给前端的你,推荐几篇前端汇总文章。(来自知乎专栏)
    使用Struts2和jQuery EasyUI实现简单CRUD系统(转载汇总)
    JavaScript、CSS、JSP 实现用户注册页面与信息校验
    Sublime-jQueryDocs
    百度CDN公共库
    Java中唯一数的生成
    MySQL主从常见的架构
    MySQL权限管理
    MySQL user表简介
  • 原文地址:https://www.cnblogs.com/yanmk/p/8118864.html
Copyright © 2011-2022 走看看