zoukankan      html  css  js  c++  java
  • Google内部培训过1.8万人的机器学习速成课

    什么是(监督)机器学习?简而言之,它是以下几点:
    
    • ML系统学习如何组合输入以产生对从未见过的数据的有用预测。
    我们来探讨基本的机器学习术语。

    标签

    一个标签是我们预测物品的属性,比如变量y在简单线性回归变量。标签可以是小麦的未来价格,图片中显示的动物的种类,音频剪辑的含义或任何东西。

    特征

    一个特征是一个输入变量 - x简单线性回归中的变量。一个简单的机器学习项目可能会使用单一功能,而更复杂的机器学习项目可能会使用数百万个功能,具体如下:
    {X1,X2,。。。Xñ}
    在垃圾邮件检测器示例中,功能可能包括以下内容:
    • 电子邮件中的文字
    • 寄件人地址
    • 发送电子邮件的时间
    • 电子邮件包含短语“一个奇怪的把戏”。

    例子

    一个例子是数据的特定实例x。(我们把 X粗体,以表明它是一个载体。)我们分手的例子分为两类:
    • 标记的例子
    • 未标记的例子
    标记的例子包括(多个)特征和标签。那是: labeled examples: {features, label}: (x, y) 使用标记的示例来训练模型。在我们的垃圾邮件检测器示例中,标记的示例将是用户明确标记为“垃圾邮件”或“非垃圾邮件”的单个电子邮件。 例如,下表显示了来自 包含加利福尼亚州房价信息的数据集中的 5个标记示例:
    住房中医年龄 (功能) totalRooms (功能) totalBedrooms (功能) medianHouseValue (标签)
    15 5612 1283 66900
    19 7650 1901 80100
    17 720 174 85700
    14 1501 337 73400
    20 1454 326 65500
    一个未标记的例子包含的特征,但不是标签,如下:   unlabeled examples: {features, ?}: (x, ?) 一旦我们用标记示例对我们的模型进行了训练,我们就可以使用该模型来预测未标记示例上的标签。在垃圾邮件检测器中,未标记的示例是人类尚未标记的新电子邮件。

    模型

    模型定义了要素和标签之间的关系。例如,垃圾邮件检测模型可能会将某些功能强烈地与“垃圾邮件”相关联。让我们强调模型的两个阶段:
    • 训练意味着创造或学习模型。也就是说,您将显示标有示例的模型,并使模型逐渐学习特征与标签之间的关系。
    • 预测意味着将训练的模型应用于未标记的例子。也就是说,你使用训练好的模型进行有用的预测(y')。例如,在推理过程中,您可以预测medianHouseValue新的未标记示例。

    回归与分类

    一个回归模型预测连续值。例如,回归模型预测回答如下问题:
    • 加州的房子价值是多少?
    • 用户点击此广告的概率是多少?
    一个分类模型预测离散值。例如,分类模型可以做出预测来回答以下问题:
    • 给定的电子邮件是垃圾邮件还是垃圾邮件?
    • 这是一只狗,一只猫还是一只仓鼠的图像?
    关键术语

    查看原文:http://www.mtcnn.com/?p=109
  • 相关阅读:
    Java实现 蓝桥杯VIP 算法训练 黑色星期五
    Java实现 蓝桥杯VIP 算法训练 比赛安排
    Java实现 蓝桥杯VIP 算法训练 比赛安排
    Java实现 蓝桥杯VIP 算法训练 斜率计算
    Java实现 蓝桥杯VIP 算法训练 斜率计算
    Java实现 蓝桥杯VIP 算法训练 整数平均值
    Java实现 蓝桥杯VIP 算法训练 整数平均值
    控件动态产生器(使用RegisterClasses提前进行注册)
    Delphi编写自定义控件以及接口的使用(做了一个TpgDbEdit)
    Log4delphi使用心得
  • 原文地址:https://www.cnblogs.com/mtcnn/p/9410020.html
Copyright © 2011-2022 走看看