zoukankan      html  css  js  c++  java
  • 机器学习概览

    一、学习方式

    1. 监督式学习
      在监督式学习下,输入数据被称为“训练数据”,每组训练数据都有一个明确的标识或结果,如对防垃圾邮件系统中的“垃圾邮件”、“非垃圾邮件”,对手写数字识别中的“1”、“2”、“3”、“4”等。在建立预测模型时,监督式学习建立一个学习过程,将预期结果与“训练数据”的实际结果进行比较,不断地调整预测模型,直到模型的预测结果达到一个预期的准确率。监督式学习的常见应用场景包括分类问题和回归问题。常规算法有逻辑回归和反向传递神经网络。
    2. 非监督式学习
      在非监督式学习下,数据并不被特别标识,学习模型是为了推断出数据的一些内在结构。常见的应用场景包括关联规则的学习及聚类等。常见算法有Apriori算法和K-Means算法。
    3. 半监督式学习
      在半监督式学习下,输入数据部分被标识,部分没有被标识。这种学习模型可以用来进行预测,但是模型首先需要学习数据的内在结构,以便合理地组织数据进行预测。其应用场景包括分类和回归。常见算法包括一些对常用监督式学习算法的延伸。这些算法首先试图对未标识的数据进行建模,然后在此基础上对标识的数据进行预测,如图论推理算法或拉普拉斯支持向量机等。
    4. 强化学习
      在强化学习下,输入数据作为对模型的反馈,不像监督模型那样,输入数据仅仅作为一种检查模型对错的方式。在强化学习下,输入数据直接反馈到模型。常见的应用场景包括动态系统及机器人控制等。常见算法包括Q-Learning及时间差学习等。
      二、算法类似性
    • 回归算法
      回归算法是试图采用对误差的衡量来探索变量之间的关系的一类算法。回归算法是统计机器学习的利器。常见的回归算法包括最小二乘法、逻辑回归、逐步式回归、多元自适应回归样条及本地散点平滑估计等。
    • 基于实例的算法
      基于实例的算法常常用来对决策问题建立模型,这样的模型常常先选取一批样本数据,然后根据某些近似性把新数据与样本数据进行比较,从而找到最佳的匹配。因此,基于实例的算法常常被称为“赢家通吃学习”或者“基于记忆的学习”。常见的算法包括k-Nearest Neighbor 、学习矢量量化及自组织映射算法等。
    • 正则化算法
      正则化算法是其他算法的延伸,根据算法的复杂度对算法进行调整。正则化算法通常对简单模型予以奖励,而对复杂算法予以惩罚。常见的算法包括Ridge Regression、LASSO及弹性网络等。
    • 决策树算法
      决策树算法根据数据的属性采取树状结构建立决策模型,常常用来解决分类和回归问题。常见的算法包括分类及回归树等。
    • 贝叶斯算法
      贝叶斯算法是基于贝叶斯定理的一类算法,主要用于解决分类和回归问题。常见的算法包括朴素贝叶斯算法、平均单依赖估计及BBN等。
    • 基于核的算法
      基于核的算法中最著名的莫过于支持向量机。基于核的算法是把输入数据映射到一个高阶的向量空间,在这些高阶向量空间里,有些分类或者回归问题能够更容易解决。常见的基于核的算法包括支持向量机、径向基函数及线性判别分析等。
    • 聚类算法
      聚类算法通常按照中心点或者分层的方式对输入数据进行归并。所有的聚类算法都试图找到数据的内在结构,以便按照最大的共同点将数据进行归类。常见的聚类算法包括K-Means算法及期望最大化算法等。
    • 关联规则学习
      关联规则学习通过寻找最能够解释数据变量之间关系的规则,来找出大量多元数据集中有用的关联规则。常见的算法包括Apriori算法和Eclat算法等。
    • 人工神经网络算法
      人工神经网络算法模拟生物神经网络,是一类模式匹配算法,通常用于解决分类和回归问题。人工神经网络是机器学习的一个庞大的分支,有几百种不同的算法。
    • 深度学习算法
      深度学习算法是对人工神经网络的发展。大多是半监督式学习算法,用来处理存在少量未标识数据的大数据集。
    • 降低维度算法
      与聚类算法一样,降低维度算法试图分析数据的内在结构,不过降低维度算法通过非监督式学习,试图利用较少的信息来归纳或者解释数据。这类算法可以用于高维数据的可视化,或者用来简化数据以便监督式学习使用。
    • 集成算法
      集成算法用一些相对较弱的学习模型独立地就同样的样本进行训练,然后把结果整合起来进行整体预测。集成算法的主要难点在于究竟集成哪些独立的、较弱的学习模型,以及如何把学习结果整合起来。这是一类强大且流行的算法。
  • 相关阅读:
    Python基础实例001:数字组合问题
    Python集合
    标量、向量、矩阵、张量
    re模块函数之search
    Python常用字符串操作
    Python基础之元组
    Bai, IEEE 2019
    词嵌入
    RNN 训练时梯度爆炸和梯度消失的理解
    OCR 综述
  • 原文地址:https://www.cnblogs.com/yeyueweiliang/p/14013492.html
Copyright © 2011-2022 走看看