zoukankan      html  css  js  c++  java
  • 机器学习十讲01

    2021.1.26
    ================
    概论
    人工智能>机器学习>深度学习
    机器学习问题
    数据->聚类、分类、预测、异常值分析
    机器学习的基本方法
    监督学习
    1、数据集中的样本带有标签,有明确目标。
    2、回归和分类。
    无监督学习
    1、数据集中的样本没有标签,没有明确目标。
    2、聚类、降维、排序、密度估计、关联规则挖掘
    *强化学习(介于前两者之间)
    1、智慧决策的过程,通过过程模拟和观察来不断学习,提高决策能力
    2、alphgo
    基本概念
    数据集:一个样本集合
    样本:数据集的一行。一个样本包含一个或多个特征,此外还可能包含一个标签。
    特征:进行预测时使用的输入变量。
    训练集:用于训练模型的数据集。
    测试集:用于测试
    模型:x,y之间的映射关系。
    损失函数:
    优化目标:
    监督学习
    回归问题
    样本数据有目标、标签,类似高中的误差分析。
    分类
    数据样本是集散类型
    找一根分割线将数据分开,具有最大分割距离是最好的
    有的数据线性不可分,可以升维。
    无监督学习
    概念:将数据集中相似的数据进行分组
    例子:K——Means聚类
    过度拟合问题
    模型过于复杂导致已知数据预测的很好,但对未知数据预测很差。
    正则化
    模型选择
    交叉验证
    K折交叉验证

  • 相关阅读:
    linux下利用valgrind工具进行内存泄露检测和性能分析
    Linux下内存泄漏工具
    linux下将不同线程绑定到不同core和cpu上——pthread_setaffinity_np
    Linux下getopt()函数
    SparkStreaming+Kafka整合
    Hive+Sqoop+Mysql整合
    crontab
    Hive与Hbase整合
    关系数据库数据与hadoop数据进行转换的工具
    Flume+Kafka+Storm+Hbase+HDSF+Poi整合
  • 原文地址:https://www.cnblogs.com/mac-13/p/14336142.html
Copyright © 2011-2022 走看看