zoukankan      html  css  js  c++  java
  • 多分类建模评估指标

    作为机器学习实践中分类领域下的一个模块,多分类问题建模也是生产生活应用中的重要组成部分;在模型构建完成之后,对多分类模型的评估影响到后期的模型决策甚至是机器学习解决方案的实际应用效果。

    准确有效评估多分类模型的性能,有利于我们建立起对当前模型水平的正确认识;由此,本文着重探讨几种常用的多分类模型评估指标。

    二分类评估指标基础

    在谈及多分类评估指标之前,首先回顾几个常见的二分类建模评估指标:

    True Positive (TP):正样本预测为正;
    True Negative (TN):负样本预测为负;
    False Positive (FP):负样本预测为正;
    False Negative (FN):正样本预测为负;

    在上述四个指标之上建立的精确率、召回率以及F1值定义如下:

    多分类评估指标之宏F1(macro-F1)

    类比于二分类评估指标,计算出各类别的精确率、召回率,然后求上述精确率和召回率的均值,再按定义求出macro-F1,如下图(图中n表示类别数):

    当然,另有一派计算macro-F1的公式,即求取各类别F1值的均值,如下图(图中n表示类别数):

    多分类评估指标之微F1(micro-F1)

    micro-F1的计算同样用到各类别的有关指标均值,即算出各类别的TP、FP、TN、FN后再计算这四个指标的均值,然后按定义计算精确率、召回率和micro-F1值,如下图:

    其实,经过数学推导可以发现,在微指标方面有以下等式:

    多分类评估指标之准确率(Accuracy)

    由前述内容,准确率(Accuracy)等于微F1值(micro-F1),其最本质的定义是指所有被正确分类的样本占总样本的比例。

    在准确率基础上,还有一个平均准确率指标,即各类别准确率的均值。

    多分类评估指标之分类报告(classification_report)和混淆矩阵(confusion_matrix)

    当然,严格地说classification_report并不算是一个评估指标,只是sklearn在内置函数库中提供了这样一个接口,以供查看上述指标的详细状况:

    上图为鸢尾花三分类的分类报告情况;
    下图为该实例的confusion_matrix情况:

    多分类建模评估指标相较于二分类的而言,确实要少一些,上述列举的是多分类指标中最为常用的,希望有所帮助!

    作者: python之家

    出处: http://www.cnblogs.com/pythonfl/

    本文版权归作者和博客园共有,转载时请标明本文出处;如对本文有疑问,欢迎邮件15256636585@qq.com联系;如发现文中内容侵犯到您的权利,请联系作者予以处理。

  • 相关阅读:
    别老想着怎么用好RPC框架,你得多花时间琢磨原理
    业务代码真的会有这么多坑?
    mac全部看视频屏幕闪烁适用于白果黑果
    iterm2 proxy配置
    源端和目标端数据对比
    frp内网穿透,rdp远程连接Windows计算机
    frp rdp远程桌面
    按块提交抽取数据
    创建索引被锁ora-00054资源正忙,但指定以nowait方式
    2017-9-17C#笔记(方法,方法参数 ,foreach语句)
  • 原文地址:https://www.cnblogs.com/pythonfl/p/14453666.html
Copyright © 2011-2022 走看看