zoukankan      html  css  js  c++  java
  • 决策树学习记录---混淆矩阵

    我们假设某计算机学院有这么一个班级,班上有40人,全是男程序员。大一的时候大家全都是单身。他们的辅导员在班会上做了这么一个预测,“到了大二,班上的张三,李四,老王等5位同学会有女朋友! 剩下的狗剩,二蛋,大头等35个同学,可能还要再等几年。”

    好的,这个时候我们可以把这位辅导员的预测写成下面这张表:

    到了大二,大家把这张表拿出来一核对,在被预计有女朋友的人里,发现除了老王,其他人还真的有了女朋友;在预计没有女朋友的人里,发现狗剩跟二蛋因为代码写得好,竟然也有了女朋友。

    这个时候,我们上面的表加工一下,可以得到下面这张表:

    稍微解释一下上面这张表。

    左上角的数据1表示“被辅导员预计有女朋友,并且实际上也有了女朋友的人数”,一共有4位。在数据分析中,我们一般把这部分的数据叫做真阳性(True Positive,简称TP),也就是预计为真,实际上也为真的数据。在数据分析里,我们常常把预计会发生的事件叫做,而把预计不会发生的事件叫做

    右上角的数据2表示“被辅导员预计有女朋友,但是实际上并没有的人数”,也就是老王一个人。在数据分析中,我们把这部分的数据叫做假阳性(False Positive, 简称FP),也就是预计为真但实际上为假的数据。

    左下角的数据3表示“被辅导员预计没有女朋友,但实际上找到了女朋友的人数”,这里有狗剩和二蛋两个人。在数据分析中,我们把这部分的数据叫做假阴性(False Negative, 简称FN), 也就是预计为假,但实际上为真的数据。

    右下角的数据4表示“被辅导员预计没有女朋友,实际上也确实没有女朋友的人数”,这里有大头等33个人。在数据分析中,我们把这部分的数据叫做真阴性(True Negative, 简称TN),也就是预计为假,实际上也为假的数据。

    我们可以把上面提到的表格简化成下面这个样子:

    我们再做进一步地简化,把它写成矩阵的样子:

    你看,这个能表示预测值和真实值之间的差距的矩阵,就是我们想要的混淆矩阵了。

    作者:晓伟
    链接:https://www.zhihu.com/question/36883196/answer/557746605
    来源:知乎

  • 相关阅读:
    过滤器为JSP文件生成静态页面
    小白自制按钮切换滚动的走马灯幻灯片脚本
    小白自制手动加定时自动滚动的走马灯幻灯片脚本
    小白自制带按钮的图片滚动幻灯片
    转 Tomcat访问日志详细配置
    小白关于走马灯幻灯片的javascript代码分析
    转 top、postop、scrolltop、offsetTop、scrollHeight、offsetHeight、clientHeight
    转 HTML精确定位:scrollLeft,scrollWidth,clientWidth,offsetWidth之完全详解
    redis 集合
    Unity自动寻路Navmesh之入门
  • 原文地址:https://www.cnblogs.com/ahochen/p/10846209.html
Copyright © 2011-2022 走看看