1structure machine learning program
1.1understanding human-level performance
human-level means different levels are corresponding to the different error value.
1.2mismatched training and dev(development set)/test set
数据不匹配的问题也叫人工数据合成,在这种情况下,首先做error analysis,观察training set和dev set这两种数据分布的不同所在。人工扩大输入样本的一个方法是人工数据合成,需要注意是否意外地模拟了所有可能样本的子集中的数据。
在做项目之前,你需要在接下来几天做的第一步工作是什么?