李宏毅机器学习课程笔记-2.3欠拟合与过拟合

zoukankan html css js c++ java

李宏毅机器学习课程笔记-2.3欠拟合与过拟合
欠拟合（Underfitting）

定义

Bias较大、Variance较小。

如果模型在训练集上的误差很大，则此时Bias是大的，情况为欠拟合。

Bias大时如何处理

使用更复杂的模型，比如添加考虑更多维度的输入、把线性模型换成非线性模型。

过拟合（Overfitting）

定义

Bias较小、Variance较大。

如果模型在训练集上的误差很小，但是在测试集上的误差很大，则此时Variance是大的，情况为过拟合。

Variance大时如何处理
- 使用更复杂的数据集
  
  比如添加数据（很有效，但不一定做得到）、数据增强等方法。
- 使用更简单的模型（不是根本方法）
  
  可能是模型过于复杂导致了过拟合，因此可以简化模型缓解过拟合。
- 正则化（Regularization）
  
  正则化可能会使Bias增大，所以需要调整正则化的参数。
  
  如(L_{new}=L_{old}+lambda sum(w_i)^2)，其中(lambda)是一个常数。
  
  加上正则项(lambda sum(w_i)^2)的目的是让函数参数的值尽可能地接近0，使函数变得更平滑。
平滑（Smooth）

定义

平滑是指输入变化影响输出变化的程度（输出对输入的敏感程度）。

假设输入变化，如果函数越不平滑，则输出变化程度越大。

函数参数越接近0，这个函数就越平滑（smooth）。

我们为什么喜欢一个平滑的函数？

适度平滑的函数可以缓解函数输入中包含的噪声对函数输出的影响。

如果输入中包含一些噪声/干扰（noise），那平滑函数的输出受输入中包含的噪声干扰的程度更小。

我们为什么不喜欢过于平滑的函数？

函数过于平滑，就无法有效地提取数据的特征，这不是我们想要的函数。

假设有一个极限平滑的函数，即该函数的输出不受输入的影响，那当然不是个好的函数。

Github（github.com）：@chouxianyu

Github Pages（github.io）：@臭咸鱼

知乎（zhihu.com）：@臭咸鱼

博客园（cnblogs.com）：@臭咸鱼

B站（bilibili.com）：@绝版臭咸鱼

微信公众号：@臭咸鱼的快乐生活

转载请注明出处，欢迎讨论和交流!
查看全文

相关阅读:
解决js跨域问题
 JS中如何使用Cookie
js 概念（构造函数）
js中this的用法
 ORA-00932：类型类型不一致
 记录一次使用 Comparator排序
 Element-ui Message消息提示限制弹出一次
 IDEA启动Tomcat的时候8080端口被占用（MyEclipse类似）
JAVA中JSONObject对象和Map对象之间的相互转换
 MySQL笔记【狂神说】

原文地址：https://www.cnblogs.com/chouxianyu/p/14185948.html

李宏毅机器学习课程笔记-2.3欠拟合与过拟合

欠拟合（Underfitting）

定义

Bias大时如何处理

过拟合（Overfitting）

定义

Variance大时如何处理

平滑（Smooth）

定义

我们为什么喜欢一个平滑的函数？

我们为什么不喜欢过于平滑的函数？