学习 定义:如果一个系统能够通过执行某个过程改进他的性能,这就是学习。
统计学习的对象:数据
目的:对数据进行预测和分析
方法:监督学习、非监督学习、半监督学习、强化学习
统计学习的三要素:方法 = 模型+策略+算法
输入变量和输出变量均为连续变量的预测问题称为回归问题
输出变量为有限个离散变量的预测问题称为分类问题
输入变量与输出变量均为变量序列的预测问题称为标注问题
模型:就是所要学习的条件概率分布或决策函数
策略:
损失函数:度量模型一次预测的好坏
风险函数:度量平均意义下模型预测的好坏
算法:指学习模型的具体计算方法