zoukankan      html  css  js  c++  java
  • GBDT(Gradient Boosting Decision Tree)粗探

    GBDT(Gradient Boosting Decision Tree)粗探

    [egin{array}{l}{ ilde{y}_{i}=-left[frac{partial Lleft(y_{i}, Fleft(x_{i} ight) ight)}{partial Fleft(x_{i} ight)} ight]_{F(x)=F_{t-1}(x)}, i=1,2, ldots N} \ {w^{*}=underset{w}{arg min } sum_{i=1}^{N}left( ilde{y}_{i}-h_{t}left(x_{i} ; w ight) ight)^{2}} \ { ho^{*}=underset{ ho}{arg min } sum_{i=1}^{N} Lleft(y_{i}, F_{t-1}left(x_{i} ight)+ ho h_{t}left(x_{i} ; w^{*} ight) ight)} \{F_{t}=F_{t-1}+f_{t}}end{array} ]

    [mathcal{L}(phi)=sum_{i} lleft(hat{y}_{i}, y_{i} ight)+sum_{k} Omegaleft(f_{k} ight) ]

    对每个样本$ i $ ,利用损失函数$ Lleft(y_{i}, Fleft(x_{i} ight) ight)$ 关于前一轮分类器预测$ F_{t-1}left(x_{i} ight)$ 的梯度(梯度由此而来)算得一个残差$ ilde{y}_{i} $ ,具体计算如下,

    [ ilde{y}_{i}=-left[frac{partial Lleft(y_{i}, Fleft(x_{i} ight) ight)}{partial Fleft(x_{i} ight)} ight]_{F(x)=F_{t-1}(x)}, i=1,2, ldots N ]

    将残差作为新的要回归或预测的变量,在特征和残差$ ilde{y}{i} $ 构成的新数据集上学到一颗新树$ h{t}left(x ; w^{*} ight)$ (树由此而来),并以损失最小化为目标确定即将要整合进去整体模型中树的权重,

    [{w^{*}=underset{w}{arg min } sum_{i=1}^{N}left( ilde{y}_{i}-h_{t}left(x_{i} ; w ight) ight)^{2}} ]

    [{ ho^{*}=underset{ ho}{arg min } sum_{i=1}^{N} Lleft(y_{i}, F_{t-1}left(x_{i} ight)+ ho h_{t}left(x_{i} ; w^{*} ight) ight)} ]

    令 $ f_{t}= ho^{}h_{t}left(x ; w^{} ight)$ ,将最新学到的树和最优系数整合进前一轮整体模型$ F_{t-1}$ 中,

    [{F_{t}=F_{t-1}+f_{t}} ]

    下面是当前一棵树的叶子个数,与上面总树的个数不相干。

    [Omega(f)=gamma T+frac{1}{2} lambda|w|^{2} ]

  • 相关阅读:
    Objective-C-使用NSMutableURLRequest发送POST请求,使用NSJSONSerialization解析JSON字符串
    js showModalDialog打开新的页面给原页面传值问题
    svn2git使用小记
    模拟等待事件row lock waits
    URAL 1994 The Emperor's plan 求组合数 大数用log+exp处理
    struts总结
    URAL 1992 CVS 链表
    android游戏物理引擎开发——粒子系统(三)
    状态模式与上机
    OpenCV——凸包
  • 原文地址:https://www.cnblogs.com/qizhien/p/11838663.html
Copyright © 2011-2022 走看看