xgboost中如何自定义metric（python中）

zoukankan html css js c++ java

xgboost中如何自定义metric（python中）
正好在参加携程的比赛，用的xgboost的算法，但携程比赛的测评函数比较奇怪，不是传统的那些，而是取precision≥0.97的情况下，recall的最大值。那无疑这个测评函数是要自己写的（官方没给），可是我怎么把它放进xgboost里呢？这样我设置silent=1时，我每一步都能看到train和eval上的结果。

起初以为在param里定义了就行，但屡屡报错，后来终于找到了方法。

首先是metric的写法（直接拿携程比赛那个来说吧）：
def maxRecall(preds,dtrain): #preds是结果（概率值），dtrain是个带label的DMatrix labels=dtrain.get_label() #提取label preds=1-preds precision,recall,threshold=precision_recall_curve(labels,preds,pos_label=0) pr=pd.DataFrame({'precision':precision,'recall':recall}) return 'Max Recall:',pr[pr.precision>=0.97].recall.max()
参数和轮数就按一般设置，然后watchlist不能少，不然就不会输出东西了，比如watchlist=[(xgb_train,'train'), (xgb_test,'eval')]

最后就是xgb.train中的内容了，写成：
bst=xgb.train(param,xg_train,n_round,watchlist,feval=maxRecall,maximize=False)
就行了。feval就是你的metric，maximize要加上，虽然不知道具体有什么用……

补充：

从大神那里学了一招，如果你需要自定义损失函数的话。先写你的损失函数，比如：

def custom_loss(y_pre,D_label): #别人的自定义损失函数
    label=D_label.get_label()
    penalty=2.0
    grad=-label/y_pre+penalty*(1-label)/(1-y_pre) #梯度
    hess=label/(y_pre**2)+penalty*(1-label)/(1-y_pre)**2 #2阶导
    return grad,hess
bst=xgb.train(param,xg_train,n_round,watchlist,feval=maxRecall,obj=custom_loss,maximize=False)
只要再加上obj=custom_loss就可以了。
查看全文

相关阅读:
Ping
boost::python开发环境搭建
 mingw和libcurl
ssh远程执行命令使用明文密码
 netty源码阅读之UnpooledByteBufAllocator
Direct ByteBuffer学习
 clions的使用
 netty中的PlatformDependent
STL之priority_queue(优先队列)
c++线程调用python

原文地址：https://www.cnblogs.com/silence-gtx/p/5812012.html

热门文章
操作系统信息
 隐藏/显示任务栏
 鼠标左右键互换
 系统输入法设置
 清空回收站
 锁定计算机
 cmd
磁盘信息
 Regist
c# 隐藏控制台应用程序