zoukankan      html  css  js  c++  java
  • 数据化风控之信用评分卡的建模与开发

    一.信用评分卡概述

    如今在银行、消费金融公司等各种贷款业务机构,普遍使用信用评分,对客户实行打分制,以期对客户有一个优质与否的评判。
    根据零售贷款生命周期不同阶段,分别开发了申请(A卡)、行为(B卡)、催收(C卡)三类评分卡。区分不同阶段的原因是由于不同阶段可获 得的客户信息是不同的,分为三类评分卡能够更充分利用这些信息来区分客户风险。

    1.申请评分卡(Application Score)

    申请评分卡主要是对每一笔新申请的贷款进行评分。主要是用在信贷准入门槛的设计和授信额度的确定方面。
    在数据上,在贷款申请阶段,很多客户历史上与 银行没有信贷关系。因此,可用来评 判贷款风险的信息主要就是客户基本 信息、第一还款来源信息、第二还款 来源信息、客户征信信息等。

    2.行为评分卡(Behavior Score)

    行为评分卡一般按月对未逾期的贷款进行评分。主要是用来在贷后管理中确定客户风险的高低,进而根据风险的不同采取不同的贷后管理手段。

    3.催收评分卡(Collection Score)

    催收评分卡一般是对当前月逾期的贷款进行评分。主要是用来在 催收管理中确定风险比较高的客户,进而根据风险的不同采取不同的催收手段。
    在贷后管理和催收管理阶段,很多贷款客户具有了丰富的行为信息, 例如最近12个月逾期的次数(贷记卡的行为信息更为丰富,例如是在 “超市购物”刷卡还是“透支取现”刷卡),这些信息比申请信息能够更 有效的区分风险。因此,有必要专门开发行为和催收评分卡来开展贷 后管理和催收管理。

    二.模型开发步骤

    首先来看模型开发框架,主要分为数据准备,模型设计,模型开发,开发验证等四个阶段。

    .

    1.模型设计

    首先根据具体的应用场景,进行模型设计。主要需要设计以下几点:

    • 确定模型的目标和分组
    • 确定样本的好坏定义
    • 确定样本数据的观察期和表现期
    • 确定样本排除规则
    • 确定样本的抽样设计
    (1)模型细分

    根据应用场景确定模型目标和客户范围,将有助于制定有针对性的业务管理政策,实施差别化的信贷管理。

    (2)好坏样本定义

    根据业务需求确定样本的好坏,即确定模型目标需要区分哪些不同类别的人群/产品。
    以催收老赖客户预测模型举例,假设银行想找到逾期客户中的老赖客户,采取更为有力的措施,首先要定义什么叫老赖客户。 可以通过滚动率分析,分析各逾期状态下进一步变坏的可能性,从而确定坏定义的建议。
    .

    上例所示,逾期M3的账户在下月滚动至更差状态M4的比例为 80.21%,而M4滚动到M5的比例为88.36%,这意味着,一旦账户到达 M3状态后,80%以上不会再变好(滚回更小的逾期状态M0-M2),同 时相比较M4与M5状态滚到更差状态的比例也基本接近,因此选取M3+ 作为坏定义是较为合理且符合业务审慎原则的选择。

    (3)确定观察期和表现期

    .

    观察点
    在这一时间点上,账户和客户的信息被作为“当前月”信息进行提取,等同于对账户/ 客户进行风险评估的生产系统中的当前月。
    观察期
    观察期主要用来收集样本的行为数据,一般是一个时间窗口,获取近几个月的行为习惯统计信息,以保证收集充分数量的样本用于评分开发。
    表现期
    一般根据样本在表现期内的表现来确定样本的好坏定义。表现期的长度需要适度,要确保观察样本的行为已充分暴露,并且已达到稳定的状态。例如,图中的绿线代表是累计坏账率,可以看到横坐标在22天左右,累计坏账率已经到达了90.97%,之后的变化较小。可以判定坏样本的行为在22天内已达到趋于稳定给的状态,表现期就可以选22天。

    .

    (4)样本排除规则

    样本排除规则需要排除在评分卡开发样本之外账户, 例如:政策拒绝客群或账户、不使用评分卡管理的客群或产品、表现不足或无 行为表现或表现可能失真的账户等。

    (5)样本抽样
    • 好坏客户抽样
      一般先把坏样本抽取出来,根据数据量按照 坏:好为1:10配比 。
    • 训练集/测试集/验证集抽样
      训练集、测试集、验证集切分比例一般是7:2:1,注意每一个集合要按抽样的好坏比分成切分。

    2.数据处理

    数据准备主要有以下步骤:

    • 数据准备
    • 数据加工
    • 数据质量分析
    • 数据清洗
    (1)数据准备

    根据模型目标和业务范围,可依据业务经验拟好备选变量和变量衍生规则,准备好能覆盖观察期和表现期的时间范围的数据。

    (2)数据加工

    梳理备选变量的数据来源以及取数规则,进行数据加工。同时,做数据探索,对备选变量进行时间维度和统计维度上的衍生或组合衍生。

    (3)数据质量分析

    可对备选变量进行数据质量分析,出数据质量报告,包括的均值,最大,最小,分位数,空值率,频数等等。 同时可对数据进行去重,做异常值和空值的标记等。(比如标记为'999')。

    (4)数据清洗

    根据数据质量报告,进行数据清洗,包括异常值剔除,高空置率变量剔除,空值填充等。

    3.模型开发

    模型开发阶段主要包括以下几个步骤:

    • 单变量分析
    • 特征选择
    • 建立模型

    (1)单变量分析

    通常,我们不会将模型备选指标直接用于模型开发,而是对指标进行适当的处理变换,然后将变换后的值作为模型备选指标的输入值进行建模。

    1.变量分箱

    分箱的主要目的是去噪,将连续数据离散化,增加粒度。
    相较于一般的指标变换方式,指标分箱的变换方式有以下优势:

    • 处理异常值和缺失值较为方便;
    • 通过栏位划分对指标进行变换,可以使得指标对于风险的趋势更加符合业务逻辑,便于理解;
    • 使得非线性的指标可以作为模型候选指标;
    • 对指标的变换更加易于操控。

    分箱变换既能够处理连续 性数据,又能够处理离散型数据。

    • 对于离散型变量,我们可直接将每个属性作为一个分箱。
    • 对于连续型数据,对于连续型变量,若变量的不同取值未超过5个,比如,“最近3个月的最大逾期月数”取值分别为 0、1、2,则可以直接按照不同取值进行分箱。否则,我们需要通过一些数据分析,确定指标的分段数 及分段节点。。一般情况下,我们可以选用的统计分析方法包括卡方检验法、WoE分析法、IV分析法等。

    一般情况下,我们可以通过以下几个判断因素进行筛选,从中选取最合理的指标分箱结果:

    • 不同分箱间的WOE差距尽量大;
    • 指标的WOE趋势图与业务逻辑一致;
    • 在开发样本中,保证指标每个分箱中有足够的坏样本;
    • 分箱截点尽量分在整数点,如年龄的分段尽量为5的倍数;
    • 分箱数量不易过多,以保证指标的稳定性。
    2.变量的WOE值分析

    Weight of Evidence (WoE) 反映了好和差的债务人的一个好坏比率,分箱 i 的WOE值计算公式如下:

    [WOE_i = ln(R\_Good_i/R\_Bad_i) ]

    其中: R_Goodi 为分箱i中好客户人数占所有好客户人数的比例,R_Badi 为分箱i中坏客户人数占所有坏客户人数的比例。

    例如,下表中以age年龄为某个指标,由于年龄是连续型指标,需要对其进行离散化处理,假设已经 离散化分为如下五组,bad和good表示在这五组中违约用户和正常用户的数量分布,最后一列是 woe值的计算。
    .

    当WoE为负数时,代表落入该分箱的客户与所有分箱的平均情况相比表现欠佳;当WoE为正数时, 则代表落入该分箱的客户与所有分箱的平均情况相比表现相对较好。

    3.变量的IV值分析

    信息值(IV,Information Value)是变量的预测能力和区分能力的统计量。
    从公式来看的话,相当于是指标woe值的一个加权求和,其 值的大小决定了指标对于目标变量的影响程度;从另一个角度来看的话,IV公式与信息熵的公式极其相似。
    IV值计算公式如下:

    [IV = sum_{i=1}^n(R\_Good_i-R\_Bad_i) * ln(R\_Good_i/R\_Bad_i) ]

    在分箱数相同 时通常取IV值最大的分箱方法作为最佳方式,其对应的IV值作为指标的最佳IV值。

    用IV衡量指标预测能力的一般标准为:
    .

    (2) 特征选择

    在信用评分卡中,对于备选变量的选择主要有以下几个步骤:

    • 剔除数据质量不满足的特征(缺失、异常、离散值过多,比如ID)
    • 根据IV值的选取(一般可以选IV阈值在0.1-1之前的变量)
    • 逻辑回归L1正则(Lasso)特征选择
    • 相关性高的变量中,剔除IV值低或者重要性低的变量 ,变量相关性计算可以使用Spearman秩相关系数等
    • 多重共线性检查
    • 人工剔除不符合业务逻辑的特征

    注:如果使用逻辑回归建模,最终一般选择8-20个特征入模

    (3) 建立模型

    备选变量入模前,需要把变量值替换为其所在分箱的WOE值。
    在信用评分卡中,模型一般使用逻辑回归,原因是可解释性强,性能稳定。
    逻辑回归模型在训练时,使用L2正则,主要调试参数:正则化项罚项:C, 好坏样本权重class_weight等。逻辑回归的原理,可以参见博文机器学习笔记之逻辑回归原理

    逻辑回归是排序预测类型的模型,其输出是一个概率值,但是输出概率的绝对值并不是一个稳定的可辨识的结果,概率高低排序才是相对准确的。比如信用评分,评分高的人比评分低的人信用更好,但是评分的绝对值并不能说明什么。相同的模型还有决策树,神经网络等。

    预测类型为决策型的模型,比如贝叶斯网络,KNN,SVM等,其预测结果是可以直接辨识的。比如人脸图像识别,可以直接知道是否为某个人的脸。

    几个模型不同的适用场景,如图:
    .
    .

    4.模型验证

    模型验证主要包括以下几个步骤:

    • 模型评估
    • 评分校准

    (1)模型评估

    该步骤主要是评估模型的预测和分辨能力(排序型模型的评估指标主要有K-S值、ROC/AUC 、GINI系数)、稳定性(PSI等),并形成模型评估报告,得出模型是否可以使用的结论。

    1.K-S值

    K-S值主要是验证模型对好、坏客户的区分能力
    假设模型对于每个客户都会预测一个信用评分 ,分数越高,表明客户信用越好。

    .

    如图,KS的计算步骤如下:

    • 根据用户的真实好坏标签,将客户分为两个部分,分别为好用户和坏用户。
    • 在模型预测全体样本的信用评分后,然后用KS统 计量来检验这两组样本信用评分的分布是否有显著 差异。横坐标把客户评分由低到高排序,纵坐标为分别计算两部分的客户的真实累计违约率。记 Fn1(x)为好客户的累计概率分布函数, Fn2(x)为坏客户的累计概率分布函数。
    • 计算K-S统计量 :K-S=MAX|Fn2(x)-Fn1(x)|,即为两个曲线间最大的差值。

    KS值与好坏区分能力关系如下表
    .

    2.CAP/AR

    CAP/AR曲线是一种研究模型对客户进行正确排序能力的方法。
    .

    假设模型对于每个客户都会预测一个信用评分
    ,分数越高,表明客户信用越好。如图,在横坐标中,假设把客户评分由低到高排序,纵坐标中计算累计违约率。

    • 完美情况为,违约客户均集中在低分区域,如图中蓝线所示,评分最低的5%的客户数,覆盖了100%的违约客户。
    • 随机情况为,违约客户均匀地分布现在各个分值区域,如图中黄线所示,好坏客户占比是一半一半的。
    • 实际情况介于完美情况和随机情况之间,如图中红线所示,即为CAP曲线。

    图中,可以看出CAP曲线越靠近左上角,说明模型的排序效果越好。实际模型与随机模型之间的面积为A,完美模型与随机模型之间的面积为B,比值A/B即为AR值。实际应用中,AR值介于0.5和0.8之间。

    AR值与好坏区分能力关系如下表
    .

    3.ROC/AUC

    ROC曲线是另一种研究模型对客户进行正确排序能力的方法。对于得分低于某一个阈值的客户,利用 模型对其进行预测,根据客户实际违约情况以及预测违约的情况不同会出现以下四种情况:

    • TP:对于实际违约的客户,将其正确的判断为违约客户
    • FP:对于实际非违约的客户,将其错误的判断为违约客户
    • TN:对于实际非违约的客户,将其正确的判断为非违约客户
    • FN:对于实际违约的客户,将其错误的判断为非违约客户

    画成一个二阶矩阵:
    .

    其中:

    • 召回率(灵敏度,TPR,True Positive Rate):TP/(TP+FN)。所有实际为违约,正确的将其判断为违约客户的比例
    • 误报率(FPR,False Positive Rate):FP/(FP+TN)。:所有实际为非违约,错误的将其判断为违约客户的比例。
    • 正确率(Accuracy Rate):(TP+TN)/(P+N)。
    • 查准率(命中率,Precision Rate):TP/P。被识别成正样本的样本中有多少是真的正样本。
      .

    ROC 曲线的绘制步骤:

    • 将所有的评分从低到高排列,低分代表高风险与高违约率,高分代表低风险与低违约率。
    • 对每一个评分取值,计算评分低于该评分的对象的FPR值,记为Xi;
    • 计算评分低于该评分的对象的TPR值,记为Yi。
    • 连接所有(Xi,Yi),即构成ROC曲线。

    AUC值表示ROC曲线下的面积,AUC值越大,表明ROC曲线越靠左上方,模型的违约区分能力就好,反之则弱。
    AUC值与模型的好坏区分能力关系如下表
    .

    从验证风险因素的违约区分能力角度,CAP曲线与ROC曲线本质上是类似的,同时有关系式 AR=2AUC-1。

    4.群体稳定性(PSI)

    群体稳定性系数(Population Stability Index, PSI)可以定量验证客户各个级别中,客户是否随时间变化(例如 时点t1和t2)有较大的变动。PSI的计算公式如下:

    .

    其中:K表示有K个评级级别,ai是时刻t1风险评级等级i中的客户数目,A是时刻t1评级客户的总数目,ci是 时刻t2风险等级i中的客户数目,C是时刻t2评级客户总数目。

    根据PSI的计算公式可以知道,如果评级模型的稳定性越好,则PSI的值越小,在模型极端稳定的情况下,PSI 的值为0。
    可以根据PSI值大小判定评级模型的稳定性,具体的判定标准是:

    • PSI<0.1,认为满意或者无改变。
    • 0.1<PSI<0.25,则需在后续的计算中密切关注。
    • PSI>0.25,则评级可能发生重大变动。

    (2)评分校准

    模型得分校准是指通过线性转换将最终模型评分与好/坏比(odds)建立一定对应关系的过程。
    评分校准公式为:

    [Score = A +B*ln(odds) ]

    其中评分校准需要3个参数:基准评分、建模数据的好/坏比(odds)、和PDO(Point Of Double odds,表示每隔多少分odds翻倍),依据这三个指标计算计算参数A、B。

    以下做一个评分校准公式计算过程的示例。

    1.计算评分与好坏比的校准公式

    由于Score每增加PDO分,odds翻倍, 则上式可以得到公式:

    [Score + PDO = A +B*ln(2*odds) ]

    两式相减,消去分数可以得到:

    [B=PDO/ln(2) ]

    假设基准评分Score= 600,PDO=20,odds=50,则B=20/ln(2)=28.9,同时将B代入第一个式子:

    [A=Score- B*ln(odds) =600-28.5*ln(50) =487.1 ]

    因此好坏比与信用评分的转换式子为:

    [Score = 487.1 +28.9*ln(odds) ]

    2.计算好坏比odds与各变量WOEi和逻辑回归系数组合的关系

    首先看逻辑回归模型与模型的好坏比的关系。

    .

    其中 ln(p/(1-p)) 即为ln(odds),所以根据逻辑回归方程式,odds等于各变量的WOEi及回归方程是系数与常数项之组合。 因此评分校准公式又可以得到以下分数尺度:

    [egin{align} Score &= A +B*ln(odds) \ &= A +B* ((sum_{i=1}^nx_i{eta}_i)+alpha) \ &= A +B* sum_{i=1}^n(x_i{eta}_i+frac{alpha}{n}) \ &= sum_{i=1}^n-(WOE_i* {eta}_i+frac{alpha}{n}) *B + frac{A}{n} end{align}]

    其中WOEi为该变量值在分组中的WOE值,n为模型回归式里的变量数量 。
    最终模型产出表如图,每个变量的一个分箱对应一个分数,直接通过这张表就可以预测出一个客户的信用评分。

    .

    参考资料:

  • 相关阅读:
    vue-cli快速搭建
    js严格模式下判断数据类型
    js实现本地的图片压缩上传预览
    web端实现图片放大切换显示预览
    swiper.js在隐藏/显示切换时,轮播出现bug的解决办法
    Zepto.js实现fadeIn,fadeOut功能
    ms
    redis 解决秒杀
    单下滑线 事务 锁
    极验
  • 原文地址:https://www.cnblogs.com/laiyaling/p/13665015.html
Copyright © 2011-2022 走看看