机器学习（西瓜书）——模型评估与选择 - 走看看

zoukankan html css js c++ java

机器学习（西瓜书）——模型评估与选择

1、评估标准

　　1）经验误差：训练集上产生的误差

　　2）泛化误差：对新样本进行预测产生的误差

　　3）过拟合：经验误差很小甚至为零，泛化误差很大（模型训练的很复杂，几乎涵盖了训练集中所有的样本点）

　　4）欠拟合：与过拟合相反

　　一般模型的泛化误差越小越好

2、评估方法

　　1）留出法：采用分层采样的方式留出验证集

　　2）交叉验证法：将数据集均分k份，留出一份作为交叉验证集，重复k次取均值

　　3）自助法：随机可重复采样m次，所得集合作为训练集，余下数据作为验证集

　　在数据集较小时，自助法比较可靠在数据集较大时，留出法和交叉验证法更常用一些

3、调参与最终模型

　　1）调参：调整模型输入参数，使得结果接近最佳，如果计算资源允许，可通过枚举方式进行

　　2）在模型选择完成后，学习算法和参数配置已选定，此时应该用数据集D重新训练模型

4、性能度量

　　回归任务中最常用的性能度量是均方误差

　　1）错误率与精度

　　2）查准率（precision）与查全率（recall）

查看全文

相关阅读:
国内BI工具/报表工具厂商简介
 国内外主流BI厂商对比
 目前国内几大著名报表软件（2014更新）
从基因组可视化工具——circos说起，circos安装
 30 个最好的数据可视化工具推荐
 用数据讲故事七种不同的数据展示方法
 大数据时代，统计学方法有多大的效果？
Oracle不能导入空表解决方案
 ORA-20000:ORU-10027:buffer overflow,limit of 10000 bytes错误4
结构体内存对齐的要素--数据成员对齐的规则

原文地址：https://www.cnblogs.com/acm-jing/p/7549905.html

Copyright © 2011-2022 走看看