zoukankan      html  css  js  c++  java
  • 数据分析九:互联网征信中的信用评分模型(用户APP使用行为分析)

    用户APP使用行为数据分析:
    一. 背景及数据介绍:
    1. 移动互联网发展背景: 网民规模7.72亿,手机网民规模7.53亿;
    2. APP使用热点:
    商务交易类应用规模高速增长(网络购物,网上外卖,在线旅行);
    互联网理财用户规模达到1.29亿,同比增长20%;
    公共服务类各细分领域规模增长(在线教育,网约车,共享单车)
    3. APP数据优势:覆盖面广,范围广;渗透生活方方面面;适用人群多样;
    4. 数据类型:基本属性信息包括性别/年龄/省份/手机价格;手机号对应的APP安装记录;

    5. 补充数据:根据APP名称去安卓市场爬取APP的详细描述(关于名称无法确定是做什么的app,通过app市场了解);

    6. 样本量:建模样本,共1000个用户,好人800个,坏人200个;

    二. 变量构建:

    这些app数据都是通过app得分得出的;

    筛选出代表性app(能区分好人和坏人的app):规则主观定;

    区分度:

    骗贷效应是存在聚集效应的:

    变量构建的技巧总结:
    构建有区分度的指标作为变量筛选的标准;
    文本分析利用TF-IDF作为标准选择;
    选择有利特征,构建新的标准;
     
    三. 数据描述:
    单偏分布,右偏分布;
     
    连续变量对分类变量的描述图,用箱线图描述比较好:
     
    四. 模型结果:
    好人app:

    坏人app:

     

    辅助放贷:

  • 相关阅读:
    linux内存的使用与page buffer (转)
    基于linux2.6.38.8内核的SDIO/wifi驱动分析(转)
    RamDisk块设备驱动实例开发讲解一
    Linux加密框架设计与实现(转)
    v4l2子系统学习心得
    一句memset引发的疑案
    linux 信号量之SIGNAL 0(转)
    可重入函数
    从ARM VIVT看linux的cache 处理
    内核抢占与preempt_count
  • 原文地址:https://www.cnblogs.com/momo798/p/11189060.html
Copyright © 2011-2022 走看看