zoukankan      html  css  js  c++  java
  • 吴恩达机器学习笔记3-应对模型误差

    一、术语

    1、欠拟合与过拟合:

      欠拟合:模型预测数据与实际数据相差太大(图1-1左边);

      过拟合:模型预测结果对于现有实的际数据有很好的准确度,但模型不能推广应用到其它新数据(图1-1右边);

                               【图1-1】

    2、训练集、验证集、测试集:

      训练集:训练数据,用以梯度下降,使得误差最小化;

      验证集:测试当前模型的准确率,我们由此调节迭代次数、学习率...;

      测试集:用以最后测试准确率的数据集;

    3、正则化:

      限制目标函数,以免过拟合;

    4、偏差、方差

      偏差:预测结果与实际的误差;

      方差:模型对不同批的同类型数据(例如 训练集、验证集),输出结果的波动程度;

    二、应对方法与问题纵览

    1、获取更多训练数据——高方差(过拟合);

    2、减少特征值——高方差(过拟合);

    3、增加特征值——高偏差(欠拟合);

    4、缩小正则化项中的λ——高偏差(欠拟合);

    5、增大正则化项中的λ——高方差(过拟合);

    三、线性回归代价函数正则化公式

    其中,J(θ)为代价函数,x,y为训练数据,θ为模型参数,式子末尾的正则化项是用来缩小每一个参数的。

     过拟合出现的原因是模型函数过于复杂,当加上一个正则化项后,可以很好地控制参数的大小,简化模型。

    当λ越大,会使得参数越小,则模型函数会更加简化,从而模型易于推广、泛化。

    四、逻辑回归代价函数正则化公式

    五、诊断方差、偏差

      记 训练集产生的代价(误差)—— J(θ)train,验证集产生的代价(误差)—— J(θ)cv

      总体方法是把 J(θ)train与 J(θ)cv比较:若J(θ)train与J(θ)cv都大,说明模型函数欠拟合,产生高偏差,预测得不够准确;

    若J(θ)train远远小于J(θ)cv说明模型函数过拟合,产生高方差,模型函数推广泛化性差。如图5-1

                  【图5-1】

  • 相关阅读:
    BurpSuite—-Spider模块(蜘蛛爬行)
    BurpSuite系列(一)----Proxy模块(代理模块)
    hadoop HA集群搭建步骤
    HBase详解
    MapReduce两种执行环境介绍:本地测试环境,服务器环境
    HBase性能优化方法总结
    HDFS原理解析
    ZooKeeper 典型应用场景
    Redis总结
    基于Apache Curator框架的ZooKeeper使用详解
  • 原文地址:https://www.cnblogs.com/Drajun/p/11115739.html
Copyright © 2011-2022 走看看