zoukankan      html  css  js  c++  java
  • 计算机视觉基础-4——物体检测

    一、什么是目标检测

    即用框(bounding box)标出物体的位置,并给出物体的类别

     一些数据集介绍:

    PASCAL VOC数据集http://host.robots.ox.ac.uk/pascal/VOC/  20类物体

    COCO数据集 http://cocodataset.org/#home 80类物体

    二、IoU介绍

    IoU:Intersection over Union,交并比。

    解释:

    1.绿色框为我们认为标定的框。

    2.红色框为预测的框。

    3.我们计算两个框的交集和并集。

    4.交集/并集就是IoU。

    三、PR曲线绘制

    PR曲线:precision-recall curve。用于评价检测器性能。

    PR曲线如何绘制:

    如上图所示,我们给定了3个人工绘制的框(绿色):

    检测器输出了5个红色框:

    其中得分表示检测器框住的东西是人的概率。我们先将其按这个得分排序:

    排好序后,我们按得分从高到低,将框与人工绘制的框进行计算IoU,当IoU大于一个阈值时,我们打上TP的标签。

    注意:每个绿色框只能匹配一次,例如1号红框与1号绿框匹配,IoU=0.9,那么1号红框标注TP,为真正例。2号红框也与1号绿框匹配,IoU=0.8,此时只能标注其为FP,即假正例。在这种情况下,上表中出现TP的个数最多就等于3。也就是说召回率最大不能超过1。

    准确率(Precision)和召回率(Recall):

    我们设定不同的阈值,在每一个阈值情况下计算P和R的值,并绘成PR曲线:

    解释:

    1.由于检测器输出只有5个框,最低得分是0.7,假设阈值为低于0.7,例如取0.6。计算P=3/5=0.6,R=3/3=1。

    2.假设阈值为0.7。P=3/4=0.75,R=3/3=1。

    3.假设阈值为0.8。P=3/3=1,R=3/3=1。

    4.假设阈值为0.9。P=3/3=1,R=2/3=0.67。

    5.假设阈值为0.9。P=3/3=1,R=1/3=0.33。

    画成PR曲线,如下图:

     

    直观理解:

      假设我们在这个例子中,检测器输出了很多很多红色框,例如100个框,他们的得分从高到低排列。假设我们将阈值取得很低,例如0.3,那么大量的框很有可能包含了所有需要检测的物体(例如30个物体),那么Recall就为1(Recall就是一共需要检测的物体中,我们检测到了的比例)。但是,由于大量的框大部分都是不准确的(只有30个框是准确框住了物体),那么准确率(Precision)就非常低(只有30%)。

      反之,我们将阈值设置得非常高,例如0.95,那么排在前面3位的框确实框住了物体,但是需要检测的物体可能有30类,虽然这3个框都框住了物体(Precision为1),但是召回率却只有3/30=10%。

    如何使用PR曲线评价一个检测器:

      我们采用PR曲线下面所包含的面积大小来评价一个检测器,面积越大,检测器越好。

    看下面这个情况:

    排名第一的红框没有框住物体,这种情况下他属于假正例(FP),那么这种情况下得PR曲线如右边所示,当阈值为0.9时,Precision和Recall都为0。

  • 相关阅读:
    初学maven五节
    Nexus如何上传自己的jar包 (upload artifactory)
    通过maven获得开源项目simple4依赖jar包的几种具体操作
    maven系列笔记(安装、下载jar、搭建私服)
    如何 提高企业网站大数据量 效率
    maven archetype:generate 的进一步理解
    为什么 Git 比 SVN 好
    使用仓库管理器——Sonatype Nexus的九大理由
    IT项目管理工具探讨之_项目群管理
    MAVEN准备建立自己的开发环境
  • 原文地址:https://www.cnblogs.com/leokale-zz/p/11163243.html
Copyright © 2011-2022 走看看