通过PAI中的流程,学习到本实例中的流程。数据预处理——特征扩充——数据切分——类型转换——归一化——缺失值填充——模型训练——预测(可视化)


通过不同特征之间的组合产生新的特征
用户购买就是一个二分类,即:买、不买。

上面的error是一个梯度——生成值与目标的差值。这个差值其实就是下图中的代价函数 J()
吴恩达中介绍的梯度下降算法模型(如下图)


下图是二分类评估的一种方法:
ROC图的左上角越靠近网格的左上角(即面积越大),预测效果越好
下图是混淆矩阵对预测结果的评估:
在PAI中可以查看训练出来的模型,也可通过部署直接生成API,