机器学习实战 | 五 | 监督式学习和无监督式学习

zoukankan html css js c++ java

机器学习实战 | 五 | 监督式学习和无监督式学习
监督式学习和无监督式学习

根据训练期间接受的监督数量和监督类型，可以将机器学习系统分为一下四个主要类别：监督式学习、无监督式学习、半监督式学习、强化学习。

监督式学习

在监督式学习中，提供给算法的包含所需解决方案的训练数据，称为标签或者标记。

分类任务是一个典型的监督式学习任务。垃圾邮件过滤系统就是一个很好的例子，通过大量的电子邮件示例以及其所属的类别（垃圾邮件或者常规邮件）进行训练，然后学习如何对新邮件进行分类。

还有典型的任务，是通过预测变量，也就是组给定的特征（里程、使用年限、品牌等）来预测一个目标数值，例如：汽车的价格。这种类型的任务称为回归任务。要训练这样一个系统，需要提供大量的汽车示例，包括他们的预测变量和标签（也就是它们的价格）。
- 在机器学习里，属性是一种数据类型；而特征取决于上下文，可能有很多个含义，但是通常状况下，特征意味着一个属性加上其值。
一些回归算法也可以用于分类任务，反之亦然。例如：逻辑回归就被广泛地用于分类，因为它可以输出“属于某个给定类别”的概率。

这里是一些最重要的监督式学习的算法：
- K-近邻算法（k-Nearest Neighbor)
- 线性回归（Linear Regression）
- 逻辑回归（Logistic Regression）
- 支持向量机（Support Vector Machines，SVM）
- 决策树和随机森林（Decision Trees and Random Forests）
- 神经网络（Nerual network）
无监督学习

无监督式学习的训练数据都是未经标记的。

这里列出一些最重要的无监督式学习的算法：
- 聚类算法：
  
  k-平均算法（k-Means）
  
  分层聚类算法（Hierarchical Cluster Analysis）
  
  最大期望算法（Expectation Maximization）
- 可视化和降维：
  
  主成分分析（PCA）
  
  核主成分分析（Kernel PCA）
  
  局部线性嵌入（LLE）
  
  t-分布随机近邻嵌入（t-SNE）
- 惯量规则学习：
  
  Apriori
  
  Eclat
通过聚类算法来检测访问博客的相似的访客，并进行分组，无法告诉这个算法每个访客属于哪个分组——希望算法自己去寻找这种关联，而无需我们的帮助，例如：算法可能注意到40%的访客喜欢夜晚访问博客、20%的访客喜欢阅读科幻小说。如果使用层次聚类算法，还可以将每一组分成更小的组。

可视化算法也是无监督式学习算法的好例子。提供大量复杂的、未标记的数据，得到轻松绘制而成的2D或者3D

的数据呈现作为输出。这些算法会尽其所能的保留更多的结构（例如：尝试保持让输入的单独集群在可视化中不会重叠），便于理解这些数据是如何组织的，甚至识别出一些特殊的模式。

与之相关的另一个任务是降维，目的是在不丢失太多信息的前提下，简化数据。方法是将多个特征合并为一个。

例如：汽车的历程与汽车的使用年限有很强的相关性，降维算法会将其合并成为一个代表汽车磨损的特征。这个过程叫作特征提取。
- 通常比较好的做法是，先使用降维算法减少训练的训练数据的维度，再将其提供给另一个机器学习算法（例如：监督式学习算法）。这会使他运行的更快，数据占用的磁盘空间和内存都会更小，执行性能可能也会更好。
另一个很重要的无监督式任务式异常检测，例如：检测异常信用卡从而防止欺诈行为，或者是在提供数据给一种机器学习算法之前，自动从数据集中移除异常值。系统使用正常的实例进行训练，然后看到新的实例时，他就可以判断出新的实例时正常还是异常。

最后，还有一个常见的无监督式任务时关联规则学习，其目的是挖掘大量数据，发现属性之间有趣的联系，例如：购买了牛排的人也很喜欢购买薯片。

半监督式学习

这些算法可以处理部分标记的训练数据——通常是大量未标记的数据和少量标记的数据，这被称为半监督学习。

照片托管服务就是很好的例子，例如：Google相册，算法中的无监督部分会先自动识别出人物A出现在了照片1、2、4中，人物B出现在了照片4、6、7中，我们只需要标记这些出现在不同照片中同一个人的名字，他就可以给每个照片的每个人命名，便于图片的搜索。

大多数半监督式学习算法是无监督式与监督式算法的结合，例如：深度信念网络（DBN）。它基于一种互相堆叠的无监督式组件，这个组件叫作受限玻尔兹曼机（RBM）。受限玻尔兹曼机以无监督的方式进行训练，然后使用监督式学习对整个系统进行微调。

强化学习

强化学习的学习系统能够观察环境，做出选择，执行操作，并获得回报，或者是以负面回报的形式获得惩罚。

他必须自行学习什么是最好的策略，从而随着时间的推移获得最大的回报。策略代表强化学习算法在特定情况下应该选择的操作。

目前，许多机器人通过强化学习算法来学习如何行走，AlphaGo和DeepMind也是强化学习的好例子。
查看全文

相关阅读:
TCP与UDP在socket编程中的区别
 使用python selenium webdriver模拟浏览器
 Web性能测试参数
 DPDK学习之开篇介绍
 go环境import cycle not allowed问题处理
 使用etcd+confd管理nginx配置
 服务的扩展性
 linux 网络编程
 单片机成长之路（stm8基础篇）- 025 stm8 时钟切换
 单片机成长之路（51基础篇）- 024 基于 N76E003 的按键按键状态机

原文地址：https://www.cnblogs.com/LYT-Dveloper/p/12825224.html

机器学习实战 | 五 | 监督式学习和无监督式学习

监督式学习和无监督式学习

监督式学习

无监督学习

半监督式学习

强化学习