对于二分类问题
混淆矩阵####
TP(真正例):将正类预测为正类
FN(假反例):将正类预测为负类
FP(假正例): 将负类预测为正类
TN(真反例): 将负类预测为负类
这么看,可能有点头晕,换个角度:
- 第一个字母(T or F):表示预测值与真实值是否一致,一致的话为T,否则为F
- 第二个字母(P or N):表示预测值为正(T)或者负(P)
三个常用指标
- 查准率:
[P = frac{TP}{TP+FP}
]
即在所有预测为正的样本里面真实值为正样本所占的比例
- 召回率:
[R=frac{TP}{TP+FN}
]
FN样本的真实标签其实为正,故分母为所有真实值为正的样本数, 即该公式表示:
所有真实值为正的样本中预测值也为正的样本数
- F1值
[F_{1}=frac{2}{frac{1}{P}+frac{1}{R}}
]
P与R的调和均值,综合衡量的查准率与召回率
mAP####
目标检测中衡量识别精度的指标是mAP(mean average precision)。多个类别物体检测中,每一个类别都可以根据recall和precision绘制一条P-R曲线,AP就是该曲线下的面积,mAP是多个类别AP的平均值。
而P-R曲线是如何绘制的呢?
检测器输出每个检测结果都会对应一个detect confidence,我们会人为设定一个confidence阈值,如果检测结果高于confidence阈值,那预测该检测为正样本,否则为预测为负。
显然,阈值设置越高,则查准率P越高,但相应召回率R就越底,我们可以通过设置不同的阈值得到P-R曲线。
[ref] (http://blog.csdn.net/a1154761720/article/details/50864994)