GBDT(Gradient Boosting Decision Tree)粗探

zoukankan html css js c++ java

GBDT(Gradient Boosting Decision Tree)粗探

GBDT(Gradient Boosting Decision Tree)粗探

[egin{array}{l}{ ilde{y}_{i}=-left[frac{partial Lleft(y_{i}, Fleft(x_{i} ight) ight)}{partial Fleft(x_{i} ight)} ight]_{F(x)=F_{t-1}(x)}, i=1,2, ldots N} \ {w^{*}=underset{w}{arg min } sum_{i=1}^{N}left( ilde{y}_{i}-h_{t}left(x_{i} ; w ight) ight)^{2}} \ { ho^{*}=underset{ ho}{arg min } sum_{i=1}^{N} Lleft(y_{i}, F_{t-1}left(x_{i} ight)+ ho h_{t}left(x_{i} ; w^{*} ight) ight)} \{F_{t}=F_{t-1}+f_{t}}end{array} ]
[mathcal{L}(phi)=sum_{i} lleft(hat{y}_{i}, y_{i} ight)+sum_{k} Omegaleft(f_{k} ight) ]
对每个样本$ i $ ，利用损失函数$ Lleft(y_{i}, Fleft(x_{i} ight) ight)$ 关于前一轮分类器预测$ F_{t-1}left(x_{i} ight)$ 的梯度（梯度由此而来）算得一个残差$ ilde{y}_{i} $ ，具体计算如下，

[ ilde{y}_{i}=-left[frac{partial Lleft(y_{i}, Fleft(x_{i} ight) ight)}{partial Fleft(x_{i} ight)} ight]_{F(x)=F_{t-1}(x)}, i=1,2, ldots N ]
将残差作为新的要回归或预测的变量，在特征和残差$ ilde{y}{i} $ 构成的新数据集上学到一颗新树$ h{t}left(x ; w^{*} ight)$ （树由此而来），并以损失最小化为目标确定即将要整合进去整体模型中树的权重，

[{w^{*}=underset{w}{arg min } sum_{i=1}^{N}left( ilde{y}_{i}-h_{t}left(x_{i} ; w ight) ight)^{2}} ]
[{ ho^{*}=underset{ ho}{arg min } sum_{i=1}^{N} Lleft(y_{i}, F_{t-1}left(x_{i} ight)+ ho h_{t}left(x_{i} ; w^{*} ight) ight)} ]
令 $ f_{t}= ho^{}h_{t}left(x ; w^{} ight)$ ，将最新学到的树和最优系数整合进前一轮整体模型$ F_{t-1}$ 中，

[{F_{t}=F_{t-1}+f_{t}} ]
下面是当前一棵树的叶子个数，与上面总树的个数不相干。

[Omega(f)=gamma T+frac{1}{2} lambda|w|^{2} ]

查看全文

相关阅读:
赋值、浅拷贝以及深拷贝的区别
 Python实现工厂模式
 Python实现代理模式
 select监听udp消息
 awk词频统计
 Python正则的贪婪和非贪婪示例
 js配置文件不缓存
 jquery事件命名空间和css-attr()
iso移动Safari页面缓存
 javaWeb禁止http不安全请求方式

原文地址：https://www.cnblogs.com/qizhien/p/11838663.html