zoukankan      html  css  js  c++  java
  • 李宏毅机器学习课程笔记-2.3欠拟合与过拟合

    欠拟合(Underfitting)

    定义

    Bias较大、Variance较小。

    如果模型在训练集上的误差很大,则此时Bias是大的,情况为欠拟合。

    Bias大时如何处理

    使用更复杂的模型,比如添加考虑更多维度的输入、把线性模型换成非线性模型。

    过拟合(Overfitting)

    定义

    Bias较小、Variance较大。

    如果模型在训练集上的误差很小,但是在测试集上的误差很大,则此时Variance是大的,情况为过拟合。

    Variance大时如何处理

    • 使用更复杂的数据集

      比如添加数据(很有效,但不一定做得到)、数据增强等方法。

    • 使用更简单的模型(不是根本方法)

      可能是模型过于复杂导致了过拟合,因此可以简化模型缓解过拟合。

    • 正则化(Regularization)

      正则化可能会使Bias增大,所以需要调整正则化的参数。

      (L_{new}=L_{old}+lambda sum(w_i)^2),其中(lambda)是一个常数。

      加上正则项(lambda sum(w_i)^2)的目的是让函数参数的值尽可能地接近0,使函数变得更平滑。

    平滑(Smooth)

    定义

    平滑是指输入变化影响输出变化的程度(输出对输入的敏感程度)。

    假设输入变化,如果函数越不平滑,则输出变化程度越大。

    函数参数越接近0,这个函数就越平滑(smooth)。

    我们为什么喜欢一个平滑的函数?

    适度平滑的函数可以缓解函数输入中包含的噪声对函数输出的影响。

    如果输入中包含一些噪声/干扰(noise),那平滑函数的输出受输入中包含的噪声干扰的程度更小。

    我们为什么不喜欢过于平滑的函数?

    函数过于平滑,就无法有效地提取数据的特征,这不是我们想要的函数。

    假设有一个极限平滑的函数,即该函数的输出不受输入的影响,那当然不是个好的函数。


    Github(github.com):@chouxianyu

    Github Pages(github.io):@臭咸鱼

    知乎(zhihu.com):@臭咸鱼

    博客园(cnblogs.com):@臭咸鱼

    B站(bilibili.com):@绝版臭咸鱼

    微信公众号:@臭咸鱼的快乐生活

    转载请注明出处,欢迎讨论和交流!


  • 相关阅读:
    【GO】GO开发环境安装及VS Code配置
    【计算机组成原理】第一章 计算机系统概论
    oracle 12.2新特性:sqlplus history
    取消交互式创建linux用户密码
    undo表空间收缩
    如何对undo表空间大小进行设置
    查看数据库实际使用多大内存
    Oracle 12.2Cgrid脚本安装失败软件完全删除
    有关rman备份ora-27192和ora-19511错误
    数据库altert日志中的GTX提示
  • 原文地址:https://www.cnblogs.com/chouxianyu/p/14185948.html
Copyright © 2011-2022 走看看