zoukankan      html  css  js  c++  java
  • 过拟合和欠拟合(Over fitting & Under fitting)

    欠拟合(Under Fitting)

    欠拟合指的是模型没有很好地学习到训练集上的规律。

    欠拟合的表现形式:

    • 当模型处于欠拟合状态时,其在训练集和验证集上的误差都很大;

    当模型处于欠拟合状态时,我们一般有以下一些办法:

    • 增加模型复杂度:比如生成更多特征供训练使用;
    • 更换成描述能力更强的模型;
    • 降低正则化水平;

     

    过拟合(Over Fitting)

    过拟合指的是模型不止学习到训练集上的规律,还把噪音学习了进去,以至于模型泛化能力差。

    过拟合的表现形式:

    • 当模型处于过拟合状态时,其在训练集上的误差很小,而在验证集上的误差会非常大。

    当模型处于过拟合状态时,我们一般有以下一些办法:

    • 增加训练样本;
    • 降低模型复杂度:比如减少特征数量,降低决策树的深度等;
    • 提高正则化水平;
    • 使用集成学习方法;

    以下是示意图:

    随着模型复杂度的提升,训练集误差(蓝线,in-sample error)越来越小,验证集误差(紫线,out-of-sample error)先变小后又变大。虚线处是理想的模型误差。

    欠拟合问题比较容易识别,且较易解决,而我们实际碰到的往往是过拟合问题。发生过拟合问题的时候,人们往往会产生一种错觉,认为此时训练出的模型非常完美,这是因为此时训练集误差非常小,几乎为0。因此,我们最好先尝试使用简单的模型,再逐渐试着换成复杂一些的模型。千万不要一开始就用很复杂的模型,因为这样非常容易过拟合。

  • 相关阅读:
    FZU 2104 Floor problem (水题)
    POJ 1797 Heavy Transportation (最短路变形)
    ZOJ 3708 Density of Power Network (水题)
    POJ 2488 A Knight's Journey (DFS)
    HDU 1198 Farm Irrigation (并查集)
    HDU 1052 Tian Ji -- The Horse Racing (贪心)
    HDU 1598 find the most comfortable road (并查集||最短路)
    poj 2533 Longest Ordered Subsequence(最长上升子序列)
    hdu 2025 查找最大元素 (水)
    hdu 5142 NPY and FFT(水)
  • 原文地址:https://www.cnblogs.com/HuZihu/p/10052387.html
Copyright © 2011-2022 走看看