分类性能度量指标

zoukankan html css js c++ java

分类性能度量指标

正确率（precision），TP/(TP+FP)，给出的是预测为正例的样本中的真正正例的比例。

召回率（recall），TP/(TP+FN)，给出的是预测为正例中的真实正例占所有真实正例的比例。

很难同时使两者达到最好。如果将任何样本都判为正例，那么召回率达到百分之百而此时的正确率很低。正确率很高时，往往会造成一些伪反例较多，从而降低召回率。

另一个用于度量分类中的分均衡性的工具是ROC曲线。在上图ROC曲线中，给出了两条线，一条虚线一条实线。图中的横轴是伪正例的比例（假阳率=FP/(FP+TN)），而纵轴是真正例的比例（真阳率=TP/(TP+FN)）。ROC曲线给出的是当阈值变化时假阳率和真阳率的变化情况。左下角的点对应将所有的样本判断为反例的情况，右上角的点对应的是将所有样例判断为正例的情况。虚线给出的是随机猜测的结果曲线。

ROC曲线不但可以用于比较分类器，还可以基于成本效益分析来作出决策。由于在不同的阈值下，不同的分类器的表现情况可能各不相同，因此以某种方式将它们组合起来或许会更有意义。如果只是简单的观察分类器的错误率，那么我们就难以得到这种更深入的洞察效果了。

理想情况下，最佳的分类器应该尽可能处于左上角。对不同ROC曲线进行比较的一个指标是曲线下的面积（AUC）。AUC给出的是分类器的平均性能值，当然它不能完全替代对整条曲线的观察。一个完美分类器的AUC为1，而随机猜测的AUC则为0.5。ROC曲线的绘制，根据分类器预测分数从大到小对样本排序，然后设置阈值逐渐随分数从大到小变化，计算不同阈值下对应的假阳率和真阳率，进而得到整个ROC曲线。

查看全文

相关阅读:
EF性能优化-有人说EF性能低，我想说：EF确实不如ADO.NET
MiniProfiler工具介绍(监控EF生成的SQL语句)--EF，迷你监控器，哈哈哈
 C# 数据库并发的解决方案（通用版、EF版）
锁、C#中Monitor和Lock以及区别
 LINQ 如何动态创建 Where 子查询
 C# Npoi 实现Excel与数据库相互导入
 MVC ActionResult派生类关系图
 如何构造树状 JSON 数据 JSON-Tree
如何构造分层次的 Json 数据
 如何使用 GroupBy 计数-Count()

原文地址：https://www.cnblogs.com/ningjing213/p/13750766.html