经验E, 任务T,性能P
设计一个学习系统
1.选择训练经验
属性:1.直接或间接反馈
2.学习器多大程度控制训练样例序列 (全部依赖,提出困惑,全新探索)
3.训练样本的分布与实际样本的是否相似
2.选择目标函数:西洋棋:最后的分数
3.选择目标函数的表示:线性函数,权重
4.逼近算法(学习算法):
估计训练值: ? 基于后续迭代估计
调整权值:
执行系统,鉴定器,泛化器,实验生成器:
x, 估计训练值,更新权值,x