混淆矩阵
二级指标:
- 准确率(Accuracy):预测正确占所有样本的比例
- 精确率(Precision):预测值为Positive的所有结果中,预测对的比重
- 召回率(Recall)灵敏度查全率:TPR::真实值为Positive的所有结果中,预测对的比重
- 特异度(Specifity):TNR::真实值为Negitive的所有结果中,预测对的比重
真正类率
假正类率
三级指标
-
F1-score:
其中:P = Precision,R = Recall -
G-mean:数据不平衡的时候,使用起来效果还挺好
其中:S = Specifity,R = Recall -
K-S曲线:
ROC 和 K-S区别联系?
- ROC曲线:取值范围在0.5-1 ---- K-S曲线:大于0.2即可判定模型比较优秀
- ROC 曲线:横轴为FPR,纵轴为TPR----K-S曲线:横轴为阈值,纵轴为FPRTPR
- ROC曲线:评价学习器性能,检验分类器对客户进行正确排序的能力----K-S曲线:学习器将正例、负例分开的能力,确定最好的截断点(即max(TPR-FPR))