zoukankan      html  css  js  c++  java
  • 机器学习十讲01

    2021.1.26
    ================
    概论
    人工智能>机器学习>深度学习
    机器学习问题
    数据->聚类、分类、预测、异常值分析
    机器学习的基本方法
    监督学习
    1、数据集中的样本带有标签,有明确目标。
    2、回归和分类。
    无监督学习
    1、数据集中的样本没有标签,没有明确目标。
    2、聚类、降维、排序、密度估计、关联规则挖掘
    *强化学习(介于前两者之间)
    1、智慧决策的过程,通过过程模拟和观察来不断学习,提高决策能力
    2、alphgo
    基本概念
    数据集:一个样本集合
    样本:数据集的一行。一个样本包含一个或多个特征,此外还可能包含一个标签。
    特征:进行预测时使用的输入变量。
    训练集:用于训练模型的数据集。
    测试集:用于测试
    模型:x,y之间的映射关系。
    损失函数:
    优化目标:
    监督学习
    回归问题
    样本数据有目标、标签,类似高中的误差分析。
    分类
    数据样本是集散类型
    找一根分割线将数据分开,具有最大分割距离是最好的
    有的数据线性不可分,可以升维。
    无监督学习
    概念:将数据集中相似的数据进行分组
    例子:K——Means聚类
    过度拟合问题
    模型过于复杂导致已知数据预测的很好,但对未知数据预测很差。
    正则化
    模型选择
    交叉验证
    K折交叉验证

  • 相关阅读:
    揭开正则表达式的神秘面纱
    海量数据库的查询优化及分页算法方案
    ASP.NET纯数字验证码
    ASP.NET四种页面导航方式之比较与选择
    C#数据结构之队列
    if exists
    使用tfs online做代码片段笔记管理
    强制删除数据库
    C# GetType()
    TreeView
  • 原文地址:https://www.cnblogs.com/mac-13/p/14336142.html
Copyright © 2011-2022 走看看