zoukankan      html  css  js  c++  java
  • 如何搭建风控决策引擎系统

    什么是风控?

    风控的本质是数据探索数据与数据之间的关联关系,根据其演变的规律,为业务所用。

    消费金融的门槛核心在于风控系统,面向客户端群体的线上产品线。如消费分期、现金贷及信用卡代偿等业务,其需实时支持大量业务的自动化处理,风控系统将承担贷前、贷中和贷后的风控评估、处理及预警的角色,极大地解放和提高人工处理的瓶颈与效率。

    优先级

    风控决策引擎是一堆风控规则的集合,通过不同的分支、层层规则的递进关系进行运算。而既然是组合的概念,则在这些规则中,以什么样的顺序与优先级执行便额外重要

    风控系统的作用在于识别绝对风控与标识相对风险,如果是绝对风控,则整套风控的审核结果便将是【拒绝】。既然结果必然是【拒绝】,则没必要运行完所有的风控规则,而主要单条触发【拒绝】即可停止剩余规则的校验。因为所有规则的运行,是需要大量的时间、金钱与性能成本的。所以,整套风控决策引擎的搭建设计思路,基于规则优先级运算的注意要点如下:

    自有规则优先于外部规则运行

    举例:本地自有的黑名单库优先于外部的黑名单数据源运行,如果触发本地自有的黑名单则风控结果可直接终止及输出【拒绝】结论。

    无成本或低成本的规则优先于高成本的规则运行

    举例:借款用户的身份特定不符合风控要求的,诸如低于18岁的用户,则可优先运行。而一些通过对接外部三方征信的风控规则,需支出相关查询费用的,则靠后运行。此外,在外部三方征信的规则中,命中式收费的风控规则(如黑名单与反欺诈)又可以优先于每次查询式收费的风控规则(如征信报告)运行。

    消耗低性能的规则优先于高性能消耗的规则运行

    举例:直接基于用户现有属性的数值,如当前用户的民族是否非少数民族,则可优先运行。而一些风控规则,需借助爬虫接口,且需待将爬取到的数据经过二次加工与汇合之后,再对汇合的总值进行判断,如手机运营商账单中的月总通话分钟时长,则此类风控规则应后置运行。

    可调整

    风控的核心思路是基于大量真实的样本数据,将逾期用户的身份、行为与数据特征进行提炼,从概率学的角度上进行剔除,从而保障到剩余用户群的逾期概率处于一个相对较低的区间。而对数据的提炼与作用过程,将使用到“参数”的定义。“参数”决定了区间和上下限范围,一条风控规则通常作用于某一数据类型,依据此数值是否满足“参数”的定义范围,得出是否可通过风控的结论。

    由于风控最终还是数据“喂出来”的结果,而非主观臆断的设限,故而,随着数据样本与内容的不断发展,必然将会涉及到一些动态的调整,后期可能会发现原本设定的“参数”过于严谨而导致审核通过较低,或者是设定得过于宽松而导致逾期率较高等。所以,整个风控决策引擎的搭建设计思路,基于可调整与可维护的注意要点如下:

    非刚需与必要的风控规则,能够“开关化”

    举例:一些必要的风控规则,如用户的银行4要素验证是否一致性,这是必要规则,就无需可开关。而一些如校验用户的芝麻信用分是否高于500分,则可做成“开关”。待该规则上线后,可通过分析此项规则的触发率得出是否合理的判断。因为芝麻信用分是否可作为决策依据将主要取决于业务方向与用户群体,因为理论上芝麻信用分的高低主要与用户在芝麻信用体系内的数据绑定维度的多与少相关,并不一定绝对反映用户的信用程度。

    风控规则上的“参数”可调整与灵活配置

    举例:很多风控体系通常会加入对手机运营商的校验,所以有一些风控规则,诸如校验用户手机号的使用时间长度是否大于6个月。其中的“6个月”便是所定义的参数,此处最好可调整与配置。因为去验证用户的稳定性,是否用“6个月”,还是用“3个月”的长度更合适?具体合理的参数是需要通过数据分析的结论进行得出,如果由于定义“6个月”长度的要求而发现其他一些手机使用时长虽然短一些,并未与用户是否逾期形成直接必然因素,那么可将该参数放松调整到“3个月”。

    记录与统计

    风控最终到底是“跑出来”的,所以,整个风控系统对所有不同风控规则的触发需进行有效的记录与统计,以便后期可支持数据分析与风控模型调整的相关工作。

    具体的记录与统计内容,主要如下:

    触发的具体风控规则

    举例:通过两种不同的视角进行记录,一是用户与订单层面,记录其所触发的明细规则;二是风控规则层面,记录某条风控规则具体的触发率。例如接了多家三方征信的反欺诈服务,通过比对这几家的触发效果,将反欺诈触发率较高的风控规则可前置执行。

    风控规则所要求的“参数”与其参数字段下的具体数值

    举例:规则定义方向,参数定义标准。其中,包含相符的与不相符都要进行记录,即便此次风控规则并未触发,如果后期发现逾期率较高,则可通过反推此风控规则并结合逾期用户的数据特性,可判断是否需调整此“参数”。

    数据源内容

    举例:某些风控规则是通过二次数据解析与汇总进行的,但原始数据需要进行保存,诸如手机账单的通话明细数据,此部分数据一是可作为风控规则使用,二是未来可用作于催收与贷后管理。

    建模

    风控体系的简单与复杂,视业务模式的开展而定。如果是固定额度与固定费率式的产品业务定价,则风控体系更多的是规则的集合。但若是有延伸的提额功能模块,与可根据用户前端不同的输入项数据,而输出与之相匹的不同的额度与费率的产品,则此时需要模型化。

    风控建模需借助于函数的定义,此外也可以借助评分卡的机制进行补充。而评分卡的模式在另外一方面也作用于系统审核与人工信审,譬如高于X评分的订单申请,系统直接通过;处于X与Y之间的评分,则需人工审核,甚至通过电话联系;而低于Y评分的,则系统直接拒绝。

    归结:风控的本质是数据,探索数据与数据之间关联关系,根据其演变的规律,为业务所用。消费金融与信贷领域的准入门槛在于风控,越是高额度的产品,对风控的要求越高。整个业务市场,如果按照风控的由简到难展开,则依次可以是:现金贷→信用卡代偿→消费金融→高额度的信用贷……

    原文参考:http://www.woshipm.com/pd/674602.html

  • 相关阅读:
    SR-IOV(Single Root I/O Virtualization)
    DHCP&DHCPv6
    Linux 上的基础网络设备详解
    当Linux用尽内存-oom
    真爱了--网络工程师技能图谱
    程序员必备技能:如何画好架构图?
    Linux内存使用情况以及内存泄露情况
    Neutron 消息回调系统
    linux bridge
    OpenStack-Neutron-code
  • 原文地址:https://www.cnblogs.com/gaoqiao/p/10954971.html
Copyright © 2011-2022 走看看