zoukankan      html  css  js  c++  java
  • 主动学习、纯半监督学习、直推学习的联系与区别

      最近在学习半监督学习方面的内容,一开始便遇到了这么几个概念:主动学习(active learning)、半监督学习(semi-supervised learning)和直推学习(transductive learning)。想必刚开始大家都觉得有点迷糊,下面就让我来详细把它们之间的联系与区别讲述一下,相信读完大家一定会思路清晰,至少在概念上不会再搞错了。

      什么是主动学习?

      主动学习指的是这样一种学习方法:有的时候,有类标的数据比较稀少而没有类标的数据是相当丰富的,但是对数据进行人工标注又非常昂贵,这时候,学习算法可以主动地提出一些标注请求,将一些经过筛选的数据提交给专家进行标注。这个筛选过程也就是主动学习主要研究的地方了。

      什么是半监督学习?

      半监督学习特指的是学习算法不需要人工干预,基于自身对未标记数据加以利用,来提高学习模型的泛化性能。

      一般认为半监督学习包含纯半监督学习直推学习

      三者的联系:

      主动学习、纯半监督学习、直推学习都属于利用未标记数据的学习技术,只是其基本思想不同。

          它们的区别:

      主动学习与半监督学习的区别:

      主动学习的主动指的是主动提出标注请求,也就是说还需要一个外在的能够对其进行标注的实体(通常是相关人员),即主动学习是交互进行的。其目标是使用尽量少的“查询”(query)来获得尽量好的性能。主动学习引入了额外的专家知识,用过与外界的交互来将部分未标记样本转变为有标记样本。

      纯半监督学习与直推学习的区别:

      假设有如下的数据集,其中训练集为XL+XU,测试集为Xtest,标记样本数目为L,未标记样本数目为U,L<<U

    • 标记样本(XL,YL)={(x1:L,y1:L)}  
    • 未标记样本XU={xL+1:N},训练时可用
    • 测试样本Xtest={xN+1:},只有在测试时才可以看到

      纯半监督学习是一种归纳学习(inductive learning),可以对测试样本Xtest进行预测。也即纯半监督学习是基于“开放世界”的假设。

      直推学习是transductive学习,仅仅可以对未标记样本XU进行标记,模型不具备对测试样本Xtest进行泛化的能力。直推学习是基于“封闭世界”的假设。

      直推学习假设未标记的数据就是最终要用来测试的数据,学习的目的就是在这些数据上取得最佳泛化能力。相对应的,纯半监督学习在学习时并不知道最终的测试用例是什么。

    ---------------------------------

      参考:1.机器学习西瓜书 周志华著

                   2.Active Learning Poll的笔记

         3.半监督学习和直推学习

          

  • 相关阅读:
    LeetCode 295. Find Median from Data Stream (堆)
    LeetCode 292. Nim Game(博弈论)
    《JavaScript 模式》读书笔记(4)— 函数2
    《JavaScript 模式》读书笔记(4)— 函数1
    《JavaScript 模式》读书笔记(3)— 字面量和构造函数3
    《JavaScript 模式》读书笔记(3)— 字面量和构造函数2
    《JavaScript 模式》读书笔记(3)— 字面量和构造函数1
    《JavaScript 模式》读书笔记(2)— 基本技巧3
    《JavaScript 模式》读书笔记(2)— 基本技巧2
    《JavaScript 模式》读书笔记(2)— 基本技巧1
  • 原文地址:https://www.cnblogs.com/yanmk/p/8118864.html
Copyright © 2011-2022 走看看