- 征信中的特征分析即:对连续变量进行分段,并检查每段中的正常和违约分布,揭示备选预测变量是否与违约率存在相关性。
- 分段的2种方法:每段中包含等量观测(等高度分段);等宽度分段
- 代码:
/* characteristics analysis */
%let dsin=..;
%let varx=..;
%let method=..;
...
%chcanalysis(&ddsin,&dvvar,&varx,&nbins,&method,&dschc);
/*输入数据集,违约状态变量(二元变量),分析变量,分段的数量,分段方法(1=等高度,2=等宽度),包含违约和正常分布 数据集 */