zoukankan html css js c++ java

【自学笔记】0基础自学机器学习（第三天）

“数据”是机器学习的基础。

初学机器学习时，我们通常处理的数据格式通常是以下的形式：

关于房价评估预测，假设该表反应为一个我们实地采集的数据，我们要从中 “机器学习” 之前首先要学习几个概念:

样本	上表中一横行为一个样本，即我们所采集到的一所房子的相关信息。
特征	上表中一纵列为一个属性（或特征），即一个房子的某些方面，如几室几厅。人们在购买房子时，几室几厅直接影响房子价格，所以我们要采集他，当然一些数据有一些非直观的影响，如当地工业程度对房价的影响。
标签	上表中最后一列为标签，即我们想要预测的内容。如该例中，我们想预测房价
数据集	所有样本的集合

数学符号还是写在纸上好...

咳咳...机器学习中包含多种任务，途中第一种被称为“监督”学习，又称“有导师学习”，第二种被称为“无监督学习”，又称“无导师学习”。

区别在于，有导师的情况下做课题，我们明确知道自己想要什么~来嘛...，比如上例中的明确所求的房价预测。

没有带领的情况下，我们要学会自己发现什么..."波蒂，我们的秘密被泄露了~"比如通过一组体检数据发现身高和体重的关系。

（未完持续）

查看全文

相关阅读:
docker学习笔记（2）——docker常用命令
 docker学习笔记（1）——ubuntu16.04安装docker（含如何彻底卸载docker，docker拉取镜像失败解决）
近期计划随笔
 程序员的自我修养:链接、装载与库（一本书，估计没时间看。。。哭。。。）
str.format 学习
 pyqt5 线程（QThread）启动、挂起、恢复、终止问题见解
 pyqt5 在非主线程（QThread线程）中实现弹窗QMessageBox
807 · 回文数 II
1334 · 旋转数组
 297 · 寻找最大值

【自学笔记】0基础自学机器学习 （第三天）