zoukankan      html  css  js  c++  java
  • PR曲线平滑

    两天写论文中,本来设计的是要画这个Precision-Recall Curve的,因为PRC是从信息检索中来的,而且我又做的类似一个检索,所以要画这个图,但是我靠,竟然发现不好画,找了很多资料等。最后也没画好,多么重要好看实用的图啊,可惜了。

           今天就花了一点功夫,专门为自己弄了个工具包,用来计算多分类问题中的Precision-Recall Curve、混淆矩阵Confusion Matrix并且进行可视化输出。

           不过Precision-Recall Curve对于每一类的画法还是很有讲究的,我们知道对于二类问题,像是检索中的问题,最后的查全率、查准率基本都是最后计算一对值就行了,但是就一对值,一个点是画不出曲线来的,所以在实际的曲线过程中,是这样的:

    1、首先得分为正负两类,多类问题真对每一类都可以映射过去

    2、按照决策值(分类问题每一个样本肯定会有一个支持分类的概率或者置信度等等,像是libsvm的dec_values的矩阵),按照从小到大的顺序进行排序

    3、然后分别计算全部样本、全本样本-1、全部样本-2、...........、一直计算完毕,每一次都会有查全率查准率,就可以曲线了,这里我说的很粗糙,详细的可以查看我的代码,当然也有函数参考的别人的,也做了说明。

     

     

    correct result / classification

     

     

    E1

    E2

    obtained
    result / classification

    E1

    tp
    (true positive)

    fp
    (false positive)

    E2

    fn
    (false negative)

    tn
    (true negative)

           Precision and recall are then defined as:

           Recall in this context is also referred to as the True Positive Rate, other related measures used in classification include True Negative Rate and Accuracy:[1]. True Negative Rate is also called Specificity.

    ------------------

    我的计算这些东西的代码包:

    PG_Curve.zip: Matlab code for computing and visualization: Confusion Matrix, Precision/Recall Curve, ROC, Accuracy, F-Measure etc. for Classification.

    红色的跳跃的就是最原始的曲线,绿色的是一个人的平滑算法。

    http://ir.sdu.edu.cn/bbs/attachments/month_1012/1012172034d1e2d6d504d716da.jpg

    http://ir.sdu.edu.cn/bbs/attachments/month_1012/101217203403151cad8caff4c3.jpg

    http://ir.sdu.edu.cn/bbs/attachments/month_1012/10121720348c1ce9557ab3335a.jpg

  • 相关阅读:
    airtest-selenium
    window下使用Redis Cluster部署Redis集群
    调用webservice进行身份验证
    ETL数据从sqlserver到mysql之间迁移
    Sqlserver调用api
    EXCEL导入数据到SQLSERVER
    博客园开通的第一天
    Visual Studio 2017 离线安装包
    WPF学习笔记1---初接触
    Visual Studio 2008 + ObjectARX2012环境配置
  • 原文地址:https://www.cnblogs.com/scnucs/p/3162164.html
Copyright © 2011-2022 走看看