zoukankan      html  css  js  c++  java
  • 建模流程


                      
     
     
    • 定义目标变量:三年还是三个月购买车险?(需要与客户沟通)哪些因素可能导致Y得发生,例如历史购买行为、年龄、收入?
    • 数据收集及整理 保证所有变量在将来模型应用中都有。
            整理所有数据,形成宽表。
            原始变量生成一些新的变量。
    • 理解目标变量与解释变量之间的关系(对分类型变量及字符型变量的处理)    待补充
    • 模型检验
    1. 系数是否正确(与业务相联系)
    2. 变量间共线性(VIF、相关系数)  
    3. R方      (AUC C)值  
    4. 变量的P值
    • 和以前的模型做对比(看是否能够打败以前的模型)
    • 设计活动策略(倾向于给打分比较高的客户做营销,把客户分成10部分,只给60%的人发)
    • 跟踪情况

    数据清洗

    1. 缺失值处理(中位数 or INDEX相近值处理)
    2. 上下限(针对连续形变量)  一般处理方法为掐头去尾
    3. 相关系数(变量与变量 Y与变量,针对进入模型的变量)
    建立模型
    • 最终模型的变量,每个变量的意义,系数,系数的P值,VIF,ROC曲线,C,AUC的值
    • 以及(10组)在数据上的表现情况(训练集、测试集、预测集)
    模型评估
     
     
     
     
     
  • 相关阅读:
    MySql——编程
    MySql——事务控制语言(DTL)
    wamp-php 集成环境的基础配置
    用户的 添加 权限 MySql远程登录
    使用模拟器调试移动端
    new关键字对构造函数做了什么
    H5与Native交互之JSBridge技术
    拍照上传头像图像旋转的问题
    Vue实现用户自定义上传头像裁剪
    H5图片压缩上传
  • 原文地址:https://www.cnblogs.com/karlpearson/p/6253088.html
Copyright © 2011-2022 走看看