参考:http://blog.sciencenet.cn/blog-995625-803323.html
原始集:概率分布为A训练集:概率分布为B测试集:概率分布为C特征工程:处理A,得到更接近C的B机器学习:拟合B,用以预测C
一.四类特征
特征工程是个过程,包括三个子模块:特征构建->特征提取->特征选择