zoukankan      html  css  js  c++  java
  • Person Re-ID行人重试别数据集

    title

    1. 杜克大学数据(DukeMTMC-reID)

    DukeMTMC 数据集是一个大规模标记的多目标多摄像机行人跟踪数据集。它提供了一个由 8 个同步摄像机记录的新型大型高清视频数据集,具有 7,000 多个单摄像机轨迹和超过 2,700 多个独立人物,DukeMTMC-reID 是 DukeMTMC 数据集的行人重识别子集,并且提供了人工标注的bounding box。

    目录结构

    DukeMTMC-reID
      ├── bounding_box_test
           ├── 0002_c1_f0044158.jpg
           ├── 3761_c6_f0183709.jpg
           ├── 7139_c2_f0160815.jpg
      ├── bounding_box_train
           ├── 0001_c2_f0046182.jpg
           ├── 0008_c3_f0026318.jpg
           ├── 7140_c4_f0175988.jpg
      ├── query
           ├── 0005_c2_f0046985.jpg
           ├── 0023_c4_f0031504.jpg
           ├── 7139_c2_f0160575.jpg
      └── CITATION_DukeMTMC.txt
      └── CITATION_DukeMTMC-reID.txt
      └── LICENSE_DukeMTMC.txt
      └── LICENSE_DukeMTMC-reID.txt
      └── README.md

    目录介绍

    从视频中每 120 帧采样一张图像,得到了 36,411 张图像。一共有 1,404个人出现在大于两个摄像头下,有 408 个人 (distractor ID) 只出现在一个摄像头下。

    1) “bounding_box_test”——用于测试集的 702 人,包含 17,661 张图像(随机采样,702 ID + 408 distractor ID)
    2) “bounding_box_train”——用于训练集的 702 人,包含 16,522 张图像(随机采样)
    3) “query”——为测试集中的 702 人在每个摄像头中随机选择一张图像作为 query,共有 2,228 张图像

    DukeMTMC-attribute数据集标注


    title

    2. 清华大学Market-1501

     Market-1501 数据集在清华大学校园中采集,夏天拍摄,在 2015 年构建并公开。它包括由6个摄像头(其中5个高清摄像头和1个低清摄像头)拍摄到的 1501 个行人、32668 个检测到的行人矩形框。每个行人至少由2个摄像头捕获到,并且在一个摄像头中可能具有多张图像。训练集有 751 人,包含 12,936 张图像,平均每个人有 17.2 张训练数据;测试集有 750 人,包含 19,732 张图像,平均每个人有 26.3 张测试数据。3368 张查询图像的行人检测矩形框是人工绘制的,而 gallery 中的行人检测矩形框则是使用DPM检测器检测得到的。该数据集提供的固定数量的训练集和测试集均可以在single-shot或multi-shot测试设置下使用。

    2.1 数据集简介

    2.2 目录结构

    Market-1501
      ├── bounding_box_test
           ├── 0000_c1s1_000151_01.jpg
           ├── 0000_c1s1_000376_03.jpg
           ├── 0000_c1s1_001051_02.jpg
      ├── bounding_box_train
           ├── 0002_c1s1_000451_03.jpg
           ├── 0002_c1s1_000551_01.jpg
           ├── 0002_c1s1_000801_01.jpg
      ├── gt_bbox
           ├── 0001_c1s1_001051_00.jpg
           ├── 0001_c1s1_009376_00.jpg
           ├── 0001_c2s1_001976_00.jpg
      ├── gt_query
           ├── 0001_c1s1_001051_00_good.mat
           ├── 0001_c1s1_001051_00_junk.mat
      ├── query
           ├── 0001_c1s1_001051_00.jpg
           ├── 0001_c2s1_000301_00.jpg
           ├── 0001_c3s1_000551_00.jpg
      └── readme.txt

    2.3 目录介绍

    1) “bounding_box_test”——用于测试集的 750 人,包含 19,732 张图像,前缀为 0000 表示在提取这 750 人的过程中DPM检测错的图(可能与query是同一个人),-1 表示检测出来其他人的图(不在这 750 人中)
    2) “bounding_box_train”——用于训练集的 751 人,包含 12,936 张图像
    3) “query”——为 750 人在每个摄像头中随机选择一张图像作为query,因此一个人的query最多有 6 个,共有 3,368 张图像
    4) “gt_query”——matlab格式,用于判断一个query的哪些图片是好的匹配(同一个人不同摄像头的图像)和不好的匹配(同一个人同一个摄像头的图像或非同一个人的图像)
    5) “gt_bbox”——手工标注的bounding box,用于判断DPM检测的bounding box是不是一个好的box

    2.4 命名规则

    以 0001_c1s1_000151_01.jpg 为例:
    1) 0001 表示每个人的标签编号,从0001到1501;
    2) c1 表示第一个摄像头(camera1),共有6个摄像头;
    3) s1 表示第一个录像片段(sequece1),每个摄像机都有数个录像段;
    4) 000151 表示 c1s1 的第000151帧图片,视频帧率25fps;
    5) 01 表示 c1s1_001051 这一帧上的第1个检测框,由于采用DPM检测器,对于每一帧上的行人可能会框出好几个bbox。00 表示手工标注框

    Market-1501_Attribute数据集属性标注


    title

    3. 香港中文大学CUHK03

    3.1 数据集简介

    CUHK03是第一个足以进行深度学习的大规模行人重识别数据集,该数据集的图像采集于香港中文大学(CUHK)校园。数据以”cuhk-03.mat”的 MAT 文件格式存储,含有 1467 个不同的人物,由 5 对摄像头采集。

    3.2 目录结构

    CUHK-03
      ├── “detected”── 5 x 1 cell
           ├── 843x10 cell
           ├── 440x10 cell
           ├── 77x10 cell
           ├── 58x10 cell
           ├── 49x10 cell
      ├── “labeled”── 5 x 1 cell
           ├── 843x10 cell
           ├── 440x10 cell
           ├── 77x10 cell
           ├── 58x10 cell
           ├── 49x10 cell
      ├── “testsets”── 20 x 1 cell
           ├── 100 x 2 double matrix

    3.3 目录介绍

    (1)”detected”—— 5 x 1 cells,由机器标注,每个 cell 中包含一对摄像头组采集的照片,如下所示:
      每个摄像头组由 M x 10 cells 组成,M 为行人索引,前 5 列和后 5 列分别来自同一组的不同摄像头。
      cell 内每个元素为一幅 H x W x 3 的行人框图像(uint8 数据类型),个别图像可能空缺,为空集。
    843x10 cell ——> 摄像头组pair 1。
    440x10 cell ——> 摄像头组pair 2。
    77x10 cell ——> 摄像头组pair 3。
    58x10 cell ——> 摄像头组pair 4。
    49x10 cell ——> 摄像头组pair 5
    (2)”labeled”—— 5 x 1 cells,行人框由人工标注,格式和内容和”detected”相同。
    (3)”testsets”—— 20 x 1 cells,测试协议,由 20 个 100 x 2 double 类型矩阵组成 (重复二十次)。
      100 x 2 double,100 行代表 100 个测试样本,第 1 列为摄像头 pair 索引,第 2 列为行人索引。



  • 相关阅读:
    新浪SAE搭建项目
    PHP ReflectionClass
    自定义时间函数
    mysql 日期函数
    jquery之商城菜单
    jquery之行自加自减
    前端之拖动面板
    商城轮播图
    js之返回网页顶部
    js之搜索框
  • 原文地址:https://www.cnblogs.com/geoffreyone/p/10314062.html
Copyright © 2011-2022 走看看