zoukankan      html  css  js  c++  java
  • 李宏毅机器学习课程笔记-2.3欠拟合与过拟合

    欠拟合(Underfitting)

    定义

    Bias较大、Variance较小。

    如果模型在训练集上的误差很大,则此时Bias是大的,情况为欠拟合。

    Bias大时如何处理

    使用更复杂的模型,比如添加考虑更多维度的输入、把线性模型换成非线性模型。

    过拟合(Overfitting)

    定义

    Bias较小、Variance较大。

    如果模型在训练集上的误差很小,但是在测试集上的误差很大,则此时Variance是大的,情况为过拟合。

    Variance大时如何处理

    • 使用更复杂的数据集

      比如添加数据(很有效,但不一定做得到)、数据增强等方法。

    • 使用更简单的模型(不是根本方法)

      可能是模型过于复杂导致了过拟合,因此可以简化模型缓解过拟合。

    • 正则化(Regularization)

      正则化可能会使Bias增大,所以需要调整正则化的参数。

      (L_{new}=L_{old}+lambda sum(w_i)^2),其中(lambda)是一个常数。

      加上正则项(lambda sum(w_i)^2)的目的是让函数参数的值尽可能地接近0,使函数变得更平滑。

    平滑(Smooth)

    定义

    平滑是指输入变化影响输出变化的程度(输出对输入的敏感程度)。

    假设输入变化,如果函数越不平滑,则输出变化程度越大。

    函数参数越接近0,这个函数就越平滑(smooth)。

    我们为什么喜欢一个平滑的函数?

    适度平滑的函数可以缓解函数输入中包含的噪声对函数输出的影响。

    如果输入中包含一些噪声/干扰(noise),那平滑函数的输出受输入中包含的噪声干扰的程度更小。

    我们为什么不喜欢过于平滑的函数?

    函数过于平滑,就无法有效地提取数据的特征,这不是我们想要的函数。

    假设有一个极限平滑的函数,即该函数的输出不受输入的影响,那当然不是个好的函数。


    Github(github.com):@chouxianyu

    Github Pages(github.io):@臭咸鱼

    知乎(zhihu.com):@臭咸鱼

    博客园(cnblogs.com):@臭咸鱼

    B站(bilibili.com):@绝版臭咸鱼

    微信公众号:@臭咸鱼的快乐生活

    转载请注明出处,欢迎讨论和交流!


  • 相关阅读:
    两数之和
    dict用法
    xgboost
    常见报错
    四、ABP 学习系列
    Apache Htpasswd生成和验证密码
    ABP 学习系列
    Gradle 配置
    ArcGis教程
    在线排程设置生成器Quartz
  • 原文地址:https://www.cnblogs.com/chouxianyu/p/14185948.html
Copyright © 2011-2022 走看看