周志华老师的《机器学习》是一本非常难得的国内学者的好教材。为了好好学习,博主决定啃一啃周老师书中的课后习题。本人答案仅供参考,若有错误,请大神们不吝指教。(本系列文章实时更新)
1.试证明对于不含冲突数据(即特征向量完全相同但标记不同)的训练集,必存在与训练集一致(即训练误差为0)的决策树。
答:不含冲突数据;决策树是按照特征来进行划分->可以得到每个叶节点中的样本的所有特征及标记完全相同的决策树->与训练集一致。
试析使用"最小训练误差"作为决策树划分选择准则的缺陷
答:使用"最小训练误差"作为决策树划分选择准则,由于使用的是训练集数据,可能会将训练特征中的一些异常或者偶然作为模型的一部分,导致过度拟合的问题。