zoukankan      html  css  js  c++  java
  • Hoeffding不等式与泛化误差上界

    1. Hoeffding不等式
      本篇文章不详细证明霍夫丁不等式怎么来的,主要讨论如何由霍夫丁不等式证明不等式:
      在这里插入图片描述
      左端即为泛化误差,右端则为泛化误差上界。泛化误差也可以理解为期望风险,而右式第一个也叫做经验风险。
      这都是与我们的的模型相关的,我们希望我们的模型对未知数据也能有好的预测能力,也就是泛化能力较强,这样才能说明我们的模型有着一定的可用性。
      证明上式则需要我们的霍夫丁不等式:
      在这里插入图片描述

    2. 泛化误差上界推导
      这里我们给出详细推导过程,并给每一步相应解释。
      如果针对二分类问题,此时误差函数取值只为 1或0 ,此时对于一组独立同分布变量X1,X2,X3…Xn。则Xi等于0或1。
      即对所有的i,有[ai,bi]=[0,1]。设F为X道Y的假设空间,此时若函数f属于该假设空间,则有:
      在这里插入图片描述

    R(f)即为期望风险,^R(f)即为经验风险,关于经验风险或期望风险有不是很了解的可以看看我之前的博客。推导过程如下由霍夫丁不等式有:

    在这里插入图片描述
    对于上式,先是将t替换再是利用bi-ai=1。得到上式。且我们可知R(f)=Sn/n),^R(f)=ESn/n。
    则可得下式
    在这里插入图片描述

    此时又有:

    在这里插入图片描述

    这里f属于假设空间的函数,但该假设空间是有限集合。第一个式子表示假设空间中函数满足上泛化误差上界公式的概率。此时它应等于每个函数满足泛化误差公式的概率的并集,这里可以将概率看成面积去理解,若每个函数都没有相交部分,则二式与三式相等,若有重合部分,则二式小于三式,这也就是二式小于等于三式的由来。再由霍夫丁不等式,则可得到四式。
    此时则可有
    在这里插入图片描述

    在这里插入图片描述

  • 相关阅读:
    nginx原理及常用配置
    课程作业03-1
    Java动手动脑02
    Java课程作业02
    java课堂测试2
    Java验证码程序
    课程作业02-2
    课程作业02-1
    课程作业01
    《大道至简》第一章伪代码
  • 原文地址:https://www.cnblogs.com/gaoxing2580/p/12423442.html
Copyright © 2011-2022 走看看