混淆矩阵(Confusion Matrix)
混淆矩阵是一个列表,里面包含了实际值和判断值的情况。下图是信息更加丰富的一张混淆矩阵图:
作为良好的学习模型,TN和TP值是高的,FP和FN值=0;但是很多场景下FP和FN都不是0,那么怎么评价个分类学习的效果(performance)呢?
Accuracy:全准率
(TP+TN)/total = (100+50)/165 = 0.91
Misclassification Rate:差错率
(FP+FN)/total = (10+5)/165 = 0.09,其实A+M=1(互补)
True Positive Rate(TPR):查全率(Recall),对于实际是yes的case,识别出来的占所有的yes的比重
TP/actual yes = 100/105 = 0.95
False Positive Rate(FPR):对于false的case,未识别出来的概率
FP/actual no = 10/60 = 0.17
Specificity:特异性,对于false的case,识别出来的概率
TN/actual no = 50/60 = 0.83
注意,和上面的FPR互补
Precision:准确率,对于yes的case,识别出来概率
TP/predicted yes = 100/110 = 0.91
参考
https://www.dataschool.io/simple-guide-to-confusion-matrix-terminology/