zoukankan      html  css  js  c++  java
  • 【自学笔记】0基础自学机器学习 (第三天)

     

    “数据”是机器学习的基础。

     

     

     

    初学机器学习时,我们通常处理的数据格式通常是以下的形式:

     

     

    属性(特征)

    几室

    几厅

    供暖(0地热 1暖气)

    ...

    临街(1临街 2不临街)

    楼层

    房价

    样本1

    3

    2

    1

    ...

    1

    5

    300000

    ...

    ...

    ...

    ...

    ...

    ...

    ...

    ...

    样本N

    4

    1

    0

    ...

    0

    2

    400000

     

     

    关于房价评估预测,假设该表反应为一个我们实地采集的数据,我们要从中 “机器学习” 之前首先要学习几个概念: 

     

     

    样本

        上表中一横行为一个样本,即我们所采集到的一所房子的相关信息。

    特征

        上表中一纵列为一个属性(或特征),即一个房子的某些方面,如几室几厅。人们在购买房子时,几室几厅直接影响房子价格,所以我们要采集他,当然一些数据有一些非直观的影响,如当地工业程度对房价的影响。

    标签

        上表中最后一列为标签,即我们想要预测的内容。如该例中,我们想预测房价

    数据集

        所有样本的集合

     

    数学符号还是写在纸上好...

     

     

    咳咳...机器学习中包含多种任务,途中第一种被称为“监督”学习,又称“有导师学习”,第二种被称为“无监督学习”,又称“无导师学习”。

    区别在于,有导师的情况下做课题,我们明确知道自己想要什么~来嘛...,比如上例中的明确所求的房价预测。

    没有带领的情况下,我们要学会自己发现什么..."波蒂,我们的秘密被泄露了~"比如通过一组体检数据发现身高和体重的关系。

    (未完持续)

     

  • 相关阅读:
    JS弹出下载对话框以及实现常见文件类型的下载
    什么是物理像素、虚拟像素、逻辑像素、设备像素,什么又是 PPI, DPI, DPR 和 DIP
    学会git玩转github,结尾有惊喜!有惊喜!有惊喜!
    Menu实现逻辑
    控件保持多种绘图状态的做法
    2个函数宏技巧
    绘图 Painter转接口封装的方式
    DirectUI消息循环的简单封装
    c++以代理的方式来实现接口化编程
    c++对象工厂
  • 原文地址:https://www.cnblogs.com/labixiaohei/p/10193318.html
Copyright © 2011-2022 走看看