zoukankan      html  css  js  c++  java
  • 游戏玩家付费金额预测

    大纲:

    赛题描述==》定位机器学习问题

    数据分析==》特征选择==》算法选择==》参数优化

    先分类,后回归,最后将每个回归模型用不同的算法进行模型融合。

    流程:

    熟悉数据:

    前105个特征是关于游戏属性,后三个特征分别是平均在线时长,7日付费金额,7日付费次数,需要预测的是45日付费金额。

    筛选特征:

     

    分类标准:

    四个特征值,一个预测值。分类,采用逻辑回归,回归预测采用DNN。

    总结:

    1.关于非均衡数据的处理方法,解决方法:欠采样、过采样、代价函数权值。若存在极度偏斜的数据时,就如同99:1,那么就可以归并为异常检测。

    2.算法的选择及优化所带来的成绩提升是有限的(5~10分之间),而正真影响到成绩的层次是特征的选择及处理,就是所谓的特征工程。当然我这场比赛打下来,80%的时间是在做特征工程。

  • 相关阅读:
    水木清华小爬虫
    不让复制是不可能的----js获取选中文字
    [转]nonlocal和global
    LLVM和clang
    Megcup2017 Dogfood
    史莱姆自爆问题
    前端颜色表
    [转]论文十诫
    返利网盈利模式
    事务的四个属性ACID
  • 原文地址:https://www.cnblogs.com/zenan/p/9577168.html
Copyright © 2011-2022 走看看