测试数据库搞好,学习了一下逾期率的官方定义:
• 对于某支标,如果某一期没有正常还款,则悲观逾期率=所有未还本金/借款本金;
• 对于一批标,悲观逾期率=当前逾期标的所有未还本金/借款本金;
• 以30天逾期率为例,30+"悲观逾期率=当前逾期30天以上标的未还本金/所有标的本金之和。
库里数据统计日期是17.2.22,有5万多个标是1.22之后的,也就是说,还未到首次还款时间,剔除之。
然后计算了一下,库中27万笔数据的逾期率:
select sum(wh)/sum(amount) from l3
结果,很受伤,高达33%:
把数据分开,按月统计标的数量和逾期率,结果:
这个就比较容易理解了,时间越往后逾期率越高,而1年前以及更早的标的,逾期率趋于稳定。我理解是逾期并非一出现就铁定逾期,随着时间的推移可能还会还。所以,比较接近真实的逾期率,应该是经过一段时间沉淀后的逾期率。这个和一些高手告知的经验也比较吻合。
尽管后面的数据肯定有用,但我的目的只是要一个相对可参考的逾期率,所以,我把样本选在了1年前的数据,即2015年3月以前的数据。