分类器性能度量

zoukankan html css js c++ java

分类器性能度量
1. TP, FP, TN, FN
1. 　　真阳性TP：预测为正样本，实际也为正样本的特征数
2. 　　假阳性FP：预测为正样本，实际为负样本的特征数
3. 　　真阴性TN：预测为负样本，实际也为负样本的特征数
4. 　　假阴性FN：预测为负样本，实际为正样本的特征数
2. 评估

正确率/精确率 TP/(TP+FP) = P

覆盖率/召回率 TP/(TP+FN) = R

特异性 TN/(FP+TN) = S

灵敏度 TP/(TP+FN) = TPR 是所有实际正例中，正确识别的正例比例

1-特异度 FP/(FP+TN) = FPR 是实际负例中，错误得识别为正例的负例比例

有时也用一个F₁值来综合评估精确率和召回率，它是精确率和召回率的调和均值。当精确率和召回率都高时,F₁值也会高。严格的数学定义如下

F-measure 2/F = 1/P + 1/R

有时候我们对精确率和召回率并不是一视同仁，比如有时候我们更加重视精确率。我们用一个参数

3. RoC曲线和PR曲线

以TPR为y轴，以FPR为x轴，我们就直接得到了RoC曲线。从FPR和TPR的定义可以理解，TPR越高，FPR越小，我们的模型和算法就越高效。也就是画出来的RoC曲线越靠近左上越好。如下图左图所示。从几何的角度讲，RoC曲线下方的面积越大越大，则模型越优。所以有时候我们用RoC曲线下的面积，即AUC（Area Under Curve）值来作为算法和模型好坏的标准。

以精确率为y轴，以召回率为x轴，我们就得到了PR曲线。仍然从精确率和召回率的定义可以理解，精确率越高，召回率越高，我们的模型和算法就越高效。也就是画出来的PR曲线越靠近右上越好。如上图右图所示。

使用RoC曲线和PR曲线，我们就能很方便的评估我们的模型的分类能力的优劣了。

参考：https://www.cnblogs.com/pinard/p/5993450.html
查看全文

相关阅读:
flexible.js 移动端自适应方案
 Vue为什么不能检测数组变动
 Vue 组件间通信六种方式
 训练首个神经网络：基本分类
 对seq2seq的粗浅认识
 数学模型的过拟合和欠拟合
 在二叉树中寻找值最大的节点并返回——LintCode入门
 Android 包管理机制
 自定义View的三种实现方式及自定义属性使用介绍
 Paint.setFlags中flag意义及使用方法

原文地址：https://www.cnblogs.com/QianYue111/p/13873459.html

分类器性能度量

1. TP, FP, TN, FN

2. 评估

3. RoC曲线和PR曲线