一、ROC曲线:
1、混淆矩阵:
针对二元分类问题,将实例分为正类或者负类,会出现四种情况:
(1)实例本身为正类,被预测为正类,即真正类(TP);
(2)实例本身为正类,被预测为负类,即假负类(FN);
(3)实例本身为负类,被预测为正类,即假正类(FP);
(4)实例本身为负类,被预测为负类,即真负类(TN);
然后可以构建混淆矩阵,如下表所示:
(1)准确率(又称查准率)Precision, P=TP/(TP+FP)
(2)召回率(又称查全率)Recall, R=TP/(TP+FN)
(3)F1-Score,F1=2PR/(P+R)
recall 体现了分类模型对正样本的识别能力,recall 越高,说明模型对正样本的识别能力越强;
precision 体现了模型对负样本的区分能力,precision越高,说明模型对负样本的区分能力越强;
F1-score 是两者的综合,F1-score 越高,说明分类模型越稳健。