zoukankan      html  css  js  c++  java
  • 第一章 机器学习基本概念

    1.机器学习主要是通过计算机在已有的数据上(经验)产生相应的模型(学习算法),在面临新的情况时,模型能给出相应的判断。所以说机器学习是研究学习算法的学问。

    2基本术语

    2.1以西瓜是否成熟为例,(色泽=青绿;根蒂=蜷缩;敲声=浊响)这一条记录称为一个示例或样本sample。样本组成的集合称为数据集;每一个示例包含几个属性,上例中包含三个属性,我们称之为三维,这个示例也可以看成是一个特征向量。一般的D={X1,X2,X3....}为一个数据集。

    2.2从数据中学习的模型的过程称之为“学习”或”训练“,这个过程使用的数据称之为训练数据,得到模型。学到的模型反应了数据的某种潜在的规律,因此也称为假设。这种规律本身称之为真相(ground truth)。一切为了逼近真相。样本一般满足一个分布D,训练数据一般满足独立同分布,所以训练集越大,越容易准确预测。

    2.3光有样本sample还不行,要建立可预测的模型需要示例的结果,样例(example),如((色泽=青绿;根蒂=蜷缩;敲声=浊响),好瓜)。

    2.4如果我们预测的是像好瓜,坏瓜这样的离散值,此类学习任务称之为“分类”,预测成熟度0.98这样的连续值,此类学习任务称之为”回归“(regression)。

    预测任务是希望通过对训练集{(X1,y1),(X2,y2)...}进行学习建立一个从输入空间X到输出空间Y的映射,对于二分类Y={0,1},对于回归Y=R实数集

    2.5根据训练数据是否有标记数据,分为无监督学习(聚类)和有监督学习(分类和回归)。

    2.6

    三年程序员,专注语音文本分析、大数据挖掘、预训练模型及知识图谱相关技术的探索
  • 相关阅读:
    CodeForcesGym 100517B Bubble Sort
    CodeForcesGym 100517H Hentium Scheduling
    BZOJ 1208: [HNOI2004]宠物收养所
    BZOJ 1503: [NOI2004]郁闷的出纳员
    BZOJ 1588: [HNOI2002]营业额统计
    sublime 3 user Settings
    sublime 3 注册码
    Why does this json4s code work in the scala repl but fail to compile?
    cat 显示指定行
    Spark Kill Application
  • 原文地址:https://www.cnblogs.com/jetHu/p/7856036.html
Copyright © 2011-2022 走看看