zoukankan      html  css  js  c++  java
  • 模型融合的结合策略

    • 平均法:对弱分类器的结果进行加权平均,常应用于回归预测模型
    • 投票法:一般应用于分类模型
    • 学习法:通过另一个学习器来进行结合,把个体学习器称为初学习器,用于结合的学习器称为次级学习器或元xuexiqi
      (1)Stacking方法:先从初级数据集训练出初级学习器,然和“生成”一个新数据集用于训练次级学习器。在这个新的数据集中,初级学习器的输出当作样例
             作为输入特征。初始样本的标记仍然作为新的样例标记。
      stacking 一般使用交叉验证的方式,初始训练集D,被划分为训练集和测试集,其中训练集被随机划分为k个大小相似的集合,然后用K-1部分训练T个模型,对另一个部分产生T个预测值作为特征,遍历每一折后,也就得到新的特征集合,注意:在完成K折交叉验证之后,得到预测值为a1, a2, a3,...还需要对整个数据的测试集进行K次预测,即为b1, b2, b3...用新的特征集合训练一个集合模型。在完成整个步骤之后,将a1, a2, a3,...拼凑起来,形成一个矩阵,记为A1, 而对于b1, b2, b3,...这部分数据,将各部分相加取平均值,即为B1
      (2)Blending方法:区别stacking方法在于训练集不是通过K折策略,而是建立一个Holdout集,,例如10%的训练数据,第二阶段的stacker模型就基于第一阶段对这10%训练数据的预测值进行拟合

    参考:

    https://blog.csdn.net/u014248127/article/details/78993753

  • 相关阅读:
    一道模拟赛题
    Codechef Union on Tree
    BZOJ3435: [Wc2014]紫荆花之恋
    BZOJ3924: [Zjoi2015]幻想乡战略游戏
    BZOJ4372: 烁烁的游戏
    BZOJ3730: 震波
    BZOJ4317: Atm的树+2051+2117
    [六省联考2017]相逢是问候(扩展欧拉定理+预处理幂)
    「BJOI2018」治疗之雨(概率+高斯消元转递推)
    「BJOI2018」链上二次求和(线段树)
  • 原文地址:https://www.cnblogs.com/xz824/p/9997385.html
Copyright © 2011-2022 走看看