数据挖掘建模过程
- 定义挖掘目标
- 数据取样
- 数据探索
- 数据预处理
- 数据清洗
- 缺失值处理:拉格朗日插值法、牛顿插值法……
- 数据集成
- 数据交换:对数据进行规范化处理
- 连续属性离散化
- 属性构造
- 小波变换:信号分析手段,基于小波变换的特征提取方法
- 数据规约:降低无效、错误数据对建模的影响,降低存储数据的成本
- 数据清洗
- 挖掘建模:分类与预测
- 模型评价
分类与预测
实现过程
- 通过训练集建立预测属性(数值型)的函数模型
- 在模型通过检验后进行预测或控制
常用的分类与预测算法
- 回归分析
- 决策树
- 人工神经网络
- 贝叶斯网络
- 支持向量机
回归分析
- 线性回归
- 非线性回归
- Logistics回归
- 岭回归
- 主成分回归
决策树
人工神经网络
分类与预测算法评价