第一步:数据收集;
第二步:数据清理和转换;
目前有很多技术能用于数据清理和转换:
1、数据类型转换;
2、连续列转换;
3、分组;
4、聚集;
5、缺失值处理;
6、删除孤立点;
第三步:模型构建
第四步:模型评估;
第五步:报告;
第六步:预测(评分);
第七步:应用集成;
第八步:模型管理;