zoukankan      html  css  js  c++  java
  • 【基础知识二】模型的评估与选择

    一、经验误差

    精度vs错误率

    1. 误差:经验误差,泛化误差

    过拟合

    欠拟合

    模型选择:理想的方案是对候选模型的泛化误差进行评估,然后选择泛化误差最小的那个模型。然而现实中无法直接获得泛化误差。

    二、评估方法

    用“测试误差”作为泛化误差的近似。

    留出法 hold-out

    交叉验证法 cross validation

    自助法 bootstrapping (有放回采样) ——在数据集较小、难以有效划分训练/测试集时很有用

    三、性能度量

    查准率 precision

    查全率 recall

    P-R图,若一个学习器的P-R曲线被另一个学习器完全“包住”,则后者性能优于前者;

    F1 是P和R的调和平均值(平滑)

    ROC与AUC

    ROC:真正例率y-假正例率x

    AUC:ROC曲线下的面积;

    四、比较检验

    问题:已知测试错误率,那么泛化错误率是多少,(泛化错误率<=测试错误率)把握有多大?

    可根据测试错误率估推出泛化错误率的分布;

    二项分布:一次留出法

    t检验:多次重复留出法,交叉验证

    五、偏差与方差

     对于回归任务

    偏差:期望输出与真实标记的差别,集算法本身的拟合能力;

    方差度量了同样大小的训练集的变动所导致学习性能的变化

    泛化误差 可分解为偏差、方差与噪声之和;

    偏差-方差dilema

  • 相关阅读:
    Docker常用命令操作记录
    第一个netty程序--时间服务
    zookeeper+dubbo配置
    通过IRBuilder新建LLVM IR
    TVM结构介绍
    /lib64/libc.so.6 错误导致的系统崩溃
    php 间歇性报 Segmentation fault
    Dell服务器安装OMSA管理工具
    【Selenium学习笔记】网页截图实践
    局域网内网机器上网实操
  • 原文地址:https://www.cnblogs.com/eniac1946/p/7331003.html
Copyright © 2011-2022 走看看