zoukankan      html  css  js  c++  java
  • 【学习笔记】分类模型的评估

    estimator.score():一般最常见使用的是准确率,即预测结果正确的百分比

    混淆矩阵

    在分类任务下,预测结果(Predicted Condition)与正确标记(True Condition)之间存在四种不同的组合,构成混淆矩阵(适用于多分类)

    精确率(Precision)与召回率(Recall)

    • 精确率:预测结果为正例样本中真实为正例的比例(查得准)

    • 召回率:真实为正例的样本中预测结果为正例的比例(查的全,对正样本的区分能力)

    • 其他分类标准,F1-score,反映了模型的稳健型

    sklearn分类模型评估API

    sklearn.metrics.classification_report(y_true, y_pred, target_names=None)

    • y_true:真实目标值
    • y_pred:估计器预测目标值
    • target_names:目标类别名称
    • return:每个类别精确率与召回率

    对于【学习笔记】分类算法-朴素贝叶斯算法中20类新闻分类例子,得出其精确率和召回率:

    from sklearn.metrics import classification_report
    
    ...
    print("每个类别的精确率和召回率
    ", classification_report(y_test, y_predict, target_names=news.target_names))
    

    运行结果:

    每个类别的精确率和召回率
                               precision    recall  f1-score   support
    
                 alt.atheism       0.87      0.87      0.87       104
               comp.graphics       0.87      0.74      0.80       143
     comp.os.ms-windows.misc       0.89      0.84      0.87       147
    comp.sys.ibm.pc.hardware       0.76      0.87      0.81       156
       comp.sys.mac.hardware       0.89      0.82      0.85       146
              comp.windows.x       0.95      0.85      0.90       149
                misc.forsale       0.91      0.75      0.82       134
                   rec.autos       0.83      0.91      0.87       142
             rec.motorcycles       0.97      0.94      0.96       160
          rec.sport.baseball       0.90      0.95      0.92       132
            rec.sport.hockey       0.96      0.92      0.94       155
                   sci.crypt       0.80      0.96      0.87       172
             sci.electronics       0.96      0.65      0.77       174
                     sci.med       0.95      0.86      0.90       145
                   sci.space       0.84      0.98      0.90       133
      soc.religion.christian       0.46      0.99      0.63       141
          talk.politics.guns       0.80      0.97      0.87       136
       talk.politics.mideast       0.94      0.94      0.94       146
          talk.politics.misc       1.00      0.59      0.74       125
          talk.religion.misc       1.00      0.13      0.24        89
    
                   micro avg       0.84      0.84      0.84      2829
                   macro avg       0.88      0.83      0.82      2829
                weighted avg       0.87      0.84      0.84      2829
    
  • 相关阅读:
    Flume(二)Flume的Source类型
    Hadoop(四)HDFS的高级API操作
    Flume(一)Flume的基础介绍与安装
    MySQL 的索引优化
    CentOS7.5安装Mysql5.7.22
    Hadoop(三)HDFS读写原理与shell命令
    iOS NSDictionary JSON 相互转换
    iOS UICollectionView 在滚动时停在某个item位置上
    vim的基本使用方法
    初次使用git上传代码到github远程仓库
  • 原文地址:https://www.cnblogs.com/zhangfengxian/p/10555592.html
Copyright © 2011-2022 走看看