1、机器学习分为监督学习和非监督学习。首先学习监督学习。
2、标签,即y值,结果,以通过机器学习过滤垃圾邮件为例,标签为邮件是垃圾邮件,或不是垃圾邮件
3、特征,即x值,输入变量,通常有多个特征,如根据发件人、邮件标题等特征来判断是否为垃圾邮件
4、样本,机器学习通过有标签样本训练模型,再通过模型对无标签样本做出预测
5、两种模型:回归模型,预测连续值,如房价,股价;分类模型,预测离散值,如垃圾邮件或非垃圾邮件,猫照片或狗照片
我们从简单的模型开始学习,如上图,一个线性代数模型,可以用y=wx+b来表示这个模型。w为斜率,也叫权重,b为y轴截距,也叫偏差。
机器学习本质 - 训练模型表示通过有标签样本来学习(确定)所有权重和偏差的理想值。即求w和b的值,使得误差最小。