zoukankan      html  css  js  c++  java
  • 机器学习实战 | 五 | 监督式学习和无监督式学习

    监督式学习和无监督式学习

    根据训练期间接受的监督数量和监督类型,可以将机器学习系统分为一下四个主要类别:监督式学习、无监督式学习、半监督式学习、强化学习。

    监督式学习

    在监督式学习中,提供给算法的包含所需解决方案的训练数据,称为标签或者标记。

    分类任务是一个典型的监督式学习任务。垃圾邮件过滤系统就是一个很好的例子,通过大量的电子邮件示例以及其所属的类别(垃圾邮件或者常规邮件)进行训练,然后学习如何对新邮件进行分类。

    还有典型的任务,是通过预测变量,也就是组给定的特征(里程、使用年限、品牌等)来预测一个目标数值,例如:汽车的价格。这种类型的任务称为回归任务。要训练这样一个系统,需要提供大量的汽车示例,包括他们的预测变量和标签(也就是它们的价格)。

    • 在机器学习里,属性是一种数据类型;而特征取决于上下文,可能有很多个含义,但是通常状况下,特征意味着一个属性加上其值。

    一些回归算法也可以用于分类任务,反之亦然。例如:逻辑回归就被广泛地用于分类,因为它可以输出“属于某个给定类别”的概率。

    这里是一些最重要的监督式学习的算法:

    • K-近邻算法(k-Nearest Neighbor)
    • 线性回归(Linear Regression)
    • 逻辑回归(Logistic Regression)
    • 支持向量机(Support Vector Machines,SVM)
    • 决策树和随机森林(Decision Trees and Random Forests)
    • 神经网络(Nerual network)

    无监督学习

    无监督式学习的训练数据都是未经标记的。

    这里列出一些最重要的无监督式学习的算法:

    • 聚类算法:
      • k-平均算法(k-Means)
      • 分层聚类算法(Hierarchical Cluster Analysis)
      • 最大期望算法(Expectation Maximization)
    • 可视化和降维:
      • 主成分分析(PCA)
      • 核主成分分析(Kernel PCA)
      • 局部线性嵌入(LLE)
      • t-分布随机近邻嵌入(t-SNE)
    • 惯量规则学习:
      • Apriori
      • Eclat

    通过聚类算法来检测访问博客的相似的访客,并进行分组,无法告诉这个算法每个访客属于哪个分组——希望算法自己去寻找这种关联,而无需我们的帮助,例如:算法可能注意到40%的访客喜欢夜晚访问博客、20%的访客喜欢阅读科幻小说。如果使用层次聚类算法,还可以将每一组分成更小的组。

    可视化算法也是无监督式学习算法的好例子。提供大量复杂的、未标记的数据,得到轻松绘制而成的2D或者3D

    的数据呈现作为输出。这些算法会尽其所能的保留更多的结构(例如:尝试保持让输入的单独集群在可视化中不会重叠),便于理解这些数据是如何组织的,甚至识别出一些特殊的模式。

    与之相关的另一个任务是降维,目的是在不丢失太多信息的前提下,简化数据。方法是将多个特征合并为一个。

    例如:汽车的历程与汽车的使用年限有很强的相关性,降维算法会将其合并成为一个代表汽车磨损的特征。这个过程叫作特征提取。

    • 通常比较好的做法是,先使用降维算法减少训练的训练数据的维度,再将其提供给另一个机器学习算法(例如:监督式学习算法)。这会使他运行的更快,数据占用的磁盘空间和内存都会更小,执行性能可能也会更好。

    另一个很重要的无监督式任务式异常检测,例如:检测异常信用卡从而防止欺诈行为,或者是在提供数据给一种机器学习算法之前,自动从数据集中移除异常值。系统使用正常的实例进行训练,然后看到新的实例时,他就可以判断出新的实例时正常还是异常。

    最后,还有一个常见的无监督式任务时关联规则学习,其目的是挖掘大量数据,发现属性之间有趣的联系,例如:购买了牛排的人也很喜欢购买薯片。

    半监督式学习

    这些算法可以处理部分标记的训练数据——通常是大量未标记的数据和少量标记的数据,这被称为半监督学习。

    照片托管服务就是很好的例子,例如:Google相册,算法中的无监督部分会先自动识别出人物A出现在了照片1、2、4中,人物B出现在了照片4、6、7中,我们只需要标记这些出现在不同照片中同一个人的名字,他就可以给每个照片的每个人命名,便于图片的搜索。

    大多数半监督式学习算法是无监督式与监督式算法的结合,例如:深度信念网络(DBN)。它基于一种互相堆叠的无监督式组件,这个组件叫作受限玻尔兹曼机(RBM)。受限玻尔兹曼机以无监督的方式进行训练,然后使用监督式学习对整个系统进行微调。

    强化学习

    强化学习的学习系统能够观察环境,做出选择,执行操作,并获得回报,或者是以负面回报的形式获得惩罚。

    他必须自行学习什么是最好的策略,从而随着时间的推移获得最大的回报。策略代表强化学习算法在特定情况下应该选择的操作。

    目前,许多机器人通过强化学习算法来学习如何行走,AlphaGo和DeepMind也是强化学习的好例子。

  • 相关阅读:
    技术管理之路三、团队建设:怎么带队伍?
    技术管理之路五、管理沟通:管理的必修课!
    职场工作方法论:计划安排,时间管理的“四象限法则”
    职场工作方法论:目标管理SMART原则
    激励方法论1、马斯洛需求模型
    mybatis PageHelper 分页组件优化
    async 和 await
    spring cloud 负载均衡 平滑上下线
    vue 重新渲染组件
    spring cloud 超时整理
  • 原文地址:https://www.cnblogs.com/LYT-Dveloper/p/12825224.html
Copyright © 2011-2022 走看看