ROC与AUC

zoukankan html css js c++ java

ROC与AUC

一、AUC

AUC：随机挑选一个正样本和一个负样本，分类算法将这个正样本排在负样本前面的概率就是AUC。AUC越大，当前的分类算法越有可能将正样本排在负样本前面，即能够更好的分类。

计算方法：

1、绘制ROC曲线，ROC曲线下的面积就是AUC的值

2. 假设总共有（m+n）个样本。其中正样本m个，负样本n个，总共有m*n个样本对。计数，正样本预测为正样本的概率大于负样本预测为正样本的概率值记为1，累加计数，然后除以（m*n）就是AUC的值

二、ROC曲线

ROC曲线：接收者操作特征（Receiver Operating Characteristic），ROC曲线上每个点反映着对同一信号刺激的感受性。

介绍一下混淆矩阵。实际中的正例、负例，预测产生的正例、负例。因此两两组合，会产生四种情况

（1）若一个实例是正例，且预测为正例，即为真正例（True Postive TP）

（2）若一个实例是正例，且预测为负例，即为假反例（False Negative FN）

（3）若一个实例是负例，且预测为正例，即为假正例（False Postive FP）

（4）若一个实例是负例，且预测为负例，即为真负例（True Negative TN）

横轴：假正例率，假正例占真实反例的比重（FPR）

纵轴：真正例率，真正例占真实正例的比重（TPR）（和召回率的公式一模一样，反映的是分类器将所有正例找出来的能力）

如下面这幅图，图中实现为ROC曲线，线上每个点对应一个阈值

横轴：FPR越大，预测正例中真实的反例越多（希望它小）

纵轴：TPR越大，预测正例中真实的正例越多（希望它大）

理想目标：TPR=1，FPR=0，即图中（0，1）点，故ROC曲线越靠拢（0，1）点，越偏离45°对角线，效果越好

ROC的取值范围应该是0.5到1，如果小于0.5，那分类器的分类效果还不如瞎蒙，这个分类器就是失败的。

查看全文

相关阅读:
一部感天动地的自学编码之旅
 c++初学
 imooc-c++学习感悟
 第二次实践作业
 大一下学期的自我目标（要求包含对大一上学期的总结、对面向对象课程完成后学习到的能力的预期，对面向对象课程的期望、对编程和专业能力的愿景规划）
面向对象程序设计 ——第二次作业（2）
面向对象程序设计 ——第二次作业（1）
面向对象程序设计 ——第一次作业
 面对对象程序设计第二次作业2
面对对象程序设计第二次作业

原文地址：https://www.cnblogs.com/gezhuangzhuang/p/10576856.html

一、AUC

二、ROC曲线