数据收集
- 在大部分情况下,收集的都是有限的数据。
数据分析
- 不光要分析当前模型的适应度,也要考察其他更多模型的适应性。
- 考察数据的有效性和真实性,不应该完全相性数据集,而要自己判断数据的准确性。
- 对于不均匀的数据(比如正数较多而负数几乎没有),需要考虑到特殊的处理方法。
- 在做模型训练时,不要过分训练模型。否则会造成对给定数据集效果非常好,但对其他数据适应性较差。
- 考虑数据量和复杂度
机器学习框架
- 现在很多模型都已经完善,调整模型参数才是重点
- 需要对模型进行评估
数学建模的目的
- 解释原理
- 预测未来