zoukankan      html  css  js  c++  java
  • 数据分析九:互联网征信中的信用评分模型(用户APP使用行为分析)

    用户APP使用行为数据分析:
    一. 背景及数据介绍:
    1. 移动互联网发展背景: 网民规模7.72亿,手机网民规模7.53亿;
    2. APP使用热点:
    商务交易类应用规模高速增长(网络购物,网上外卖,在线旅行);
    互联网理财用户规模达到1.29亿,同比增长20%;
    公共服务类各细分领域规模增长(在线教育,网约车,共享单车)
    3. APP数据优势:覆盖面广,范围广;渗透生活方方面面;适用人群多样;
    4. 数据类型:基本属性信息包括性别/年龄/省份/手机价格;手机号对应的APP安装记录;

    5. 补充数据:根据APP名称去安卓市场爬取APP的详细描述(关于名称无法确定是做什么的app,通过app市场了解);

    6. 样本量:建模样本,共1000个用户,好人800个,坏人200个;

    二. 变量构建:

    这些app数据都是通过app得分得出的;

    筛选出代表性app(能区分好人和坏人的app):规则主观定;

    区分度:

    骗贷效应是存在聚集效应的:

    变量构建的技巧总结:
    构建有区分度的指标作为变量筛选的标准;
    文本分析利用TF-IDF作为标准选择;
    选择有利特征,构建新的标准;
     
    三. 数据描述:
    单偏分布,右偏分布;
     
    连续变量对分类变量的描述图,用箱线图描述比较好:
     
    四. 模型结果:
    好人app:

    坏人app:

     

    辅助放贷:

  • 相关阅读:
    Java多线程
    SpringCloud
    Java 多线程
    MySQL
    MySQL
    SpringCloud
    SpringCloud
    SpringCloud
    SpringBoot
    Spring MVC
  • 原文地址:https://www.cnblogs.com/momo798/p/11189060.html
Copyright © 2011-2022 走看看