【基础知识二】模型的评估与选择 - 走看看

zoukankan html css js c++ java

【基础知识二】模型的评估与选择

一、经验误差

精度vs错误率

1. 误差：经验误差，泛化误差

过拟合

欠拟合

模型选择：理想的方案是对候选模型的泛化误差进行评估，然后选择泛化误差最小的那个模型。然而现实中无法直接获得泛化误差。

二、评估方法

用“测试误差”作为泛化误差的近似。

留出法 hold-out

交叉验证法 cross validation

自助法 bootstrapping （有放回采样） ——在数据集较小、难以有效划分训练/测试集时很有用

三、性能度量

查准率 precision

查全率 recall

P-R图，若一个学习器的P-R曲线被另一个学习器完全“包住”，则后者性能优于前者；

F1 是P和R的调和平均值（平滑）

ROC与AUC

ROC：真正例率y-假正例率x

AUC：ROC曲线下的面积；

四、比较检验

问题：已知测试错误率，那么泛化错误率是多少，（泛化错误率<=测试错误率）把握有多大？

可根据测试错误率估推出泛化错误率的分布；

二项分布：一次留出法

t检验：多次重复留出法，交叉验证

五、偏差与方差

对于回归任务

偏差：期望输出与真实标记的差别，集算法本身的拟合能力；

方差度量了同样大小的训练集的变动所导致学习性能的变化

泛化误差可分解为偏差、方差与噪声之和；

偏差-方差dilema

查看全文

相关阅读:
maven项目install时候一直报错，检查Maven-javadoc-plugin声明错误（Java 8 配置Maven-javadoc-plugin）或者是：警告: @throws 没有说明
 maven-gpg-plugin:1.2:sign (sign-artifacts) on project jdbc-pool: Cannot obtain passphrase in batch mode或者是Plugin execution not covered by lifecycle configuration
org.eclipse.jdt.internal.compiler包下的类找不到
 Java finally语句到底是在return之前还是之后执行？
lamp环境编译安装curl扩展
 PHP使用CURL获取302跳转后的地址实例
 php之curl设置超时实例
 php 使用curl 将文件上传
 PHP中CURL方法curl_setopt()函数的一些参数
 基于PHP的cURL快速入门

原文地址：https://www.cnblogs.com/eniac1946/p/7331003.html

Copyright © 2011-2022 走看看