1.混淆矩阵是机器学习中总结分类模型预测结果的情形分析表,以矩阵形式将数据集中的记录按照真实的类别与分类模型预测的类别判断两个标准进行汇总
2.分类评估指标中定义的一些符号含义:
TP(True Positive) :将正类预测为正类数,真实为0,预测为0
FN(False Negative):将正类预测为负类数,真实为0,预测为1
FP(False Positive) :将负类预测为正类数,真实为1,预测为0
TN(True Negative) :将负类预测为负类数,真实为1,预测为1
3.矩阵表现形式:
(注:矩阵的行表示真实值,列表示预测值)
二分类:
混淆矩阵 | 预测值 | ||
0 | 1 | ||
真实值 | 0 | a | b |
1 | c | d |
于是有: TP = a; FN = b; FP = c; TN = d.
$Precision$=$frac{a}{a+c}$=$frac{TP}{TP+FP}$,
$Recall$=$frac{a}{a+b}$=$frac{TP}{TP+FN}$,
$Accuracy$=$frac{a+d}{a+b+c+d}$=$frac{TP+TN}{TP+FN+FP+TN}$,
$F1$=$2*frac{Recall*Accuracy}{Recall + Accuracy} $