总结自《机器学习》周志华 2.3
目录
最常用的是查准率P(precision),查全率R(recall),F1
一、对于二分类问题
二、对于多分类问题
1.macro
2.micro
最常用的是查准率P(precision),查全率R(recall),F1
一、对于二分类问题
混淆矩阵(confusion matrix):
预测结果 | ||
真实情况 | 正例 | 反例 |
正例 | TP,true positive,真正 | FN,false negative 假反 |
反例 | FP ,false positive,假正 | TN,true negative 真反 |
查准率=真正 / (真正+假正) = predicted and true positive/ predicted positive
查全率= 真正 /(真正+假反) = predicted and true positive/ true positive
P , R是一对矛盾的度量,一般一个的值高了,另一个的值就会降低,
P-R图:
若学习器A的 P-R曲线 将学习器B的 P-R曲线 完全包住,则学习器A 在该问题上 优于 B
若A B的P-R曲线有交叉, 则比较P-R曲线下面积的大小,越大越好
平衡点 break even point BEP,是P==R 时的取值
F值度量:
,n为样例总数
β>1,R有更大影响,β<1,P有更大影响
二、对于多分类问题
多分类问题,每两两类别组合,构成n个二分类问题,每个二分类问题对应一个混淆矩阵
1.macro
先在各个混淆矩阵上分别计算P,R, 再求平均得到 宏查准率macro-P, 宏查全率macro-R,
基于宏查准率macro-P, 宏查全率macro-R,计算 宏F1 macro-F1
2.micro
将各个混淆矩阵的对应元素进行平均,得到TP,FP,TN,FN的平均值: