zoukankan      html  css  js  c++  java
  • 【基础知识二】模型的评估与选择

    一、经验误差

    精度vs错误率

    1. 误差:经验误差,泛化误差

    过拟合

    欠拟合

    模型选择:理想的方案是对候选模型的泛化误差进行评估,然后选择泛化误差最小的那个模型。然而现实中无法直接获得泛化误差。

    二、评估方法

    用“测试误差”作为泛化误差的近似。

    留出法 hold-out

    交叉验证法 cross validation

    自助法 bootstrapping (有放回采样) ——在数据集较小、难以有效划分训练/测试集时很有用

    三、性能度量

    查准率 precision

    查全率 recall

    P-R图,若一个学习器的P-R曲线被另一个学习器完全“包住”,则后者性能优于前者;

    F1 是P和R的调和平均值(平滑)

    ROC与AUC

    ROC:真正例率y-假正例率x

    AUC:ROC曲线下的面积;

    四、比较检验

    问题:已知测试错误率,那么泛化错误率是多少,(泛化错误率<=测试错误率)把握有多大?

    可根据测试错误率估推出泛化错误率的分布;

    二项分布:一次留出法

    t检验:多次重复留出法,交叉验证

    五、偏差与方差

     对于回归任务

    偏差:期望输出与真实标记的差别,集算法本身的拟合能力;

    方差度量了同样大小的训练集的变动所导致学习性能的变化

    泛化误差 可分解为偏差、方差与噪声之和;

    偏差-方差dilema

  • 相关阅读:
    0903编写ssh实现远程执行命令 并解决粘包问题
    学习日记0829 IP协议 子网掩码 端口TCP协议的三次握手 四次挥手 套接字socket
    学习日记0828单例 OSI七层协议
    学习日记0827异常处理 元类 自定义元类 自定义元类来实例化类 属性查找顺序
    函数装饰器
    函数对象
    参数
    函数
    文件操作
    字符编码
  • 原文地址:https://www.cnblogs.com/eniac1946/p/7331003.html
Copyright © 2011-2022 走看看