Title: Scalable Person Re-identification: A Benchmark
Authors: Liang Zheng13∗, Liyue Shen1∗, Lu Tian1∗, Shengjin Wang1 , Jingdong Wang3 , Qi Tian2
Affiliations: 1Tsinghua University 2Microsoft Research 3University of Texas at San Antonio
Contribution
1 提出了Market-1501数据集
该数据集的提出是针对之前数据集的不足,包括:
- 规模有限
- 行人边框都是手工标记的(比较完美),不符合实际
- 每个identity只有一个query和ground truth,过于封闭
Market-1501做的改进包括
- 数据集规模当时最大:超过32000个标注的包围框,加上一个超过500K张图像的干扰集
- 包含自动标注的行人边框(自动检测算法是Deformable Part Model (DPM))
- 每个identity有多个摄像头多张影像
Market-1501数据集描述:
- 场景是学校内
- 6台摄像机,包括5台1280×1080高清摄像机和一台720×576 SD摄像机(摄像头之间存在重叠)
- 包含1501个行人的32,668个标注框
- 增加了一个额外的干扰集。该数据集包含超过500,000个包围框,包含背景虚假警报以及不属于1,501个标注行人的行人
表1. Market-1501与其他数据集的比较
2 评价指标
CMC曲线显示了待查询行人出现在不同大小的候选列表中的概率。只有在给定查询只有一个真实匹配的情况下(见图3(a) ),该评估测量才有效。在这种情况下,精确度和召回率是同样的问题。但是,如果存在多个真实匹配,则 CMC曲线存在偏差,因为未考虑“召回率”。例如,图3(b) 和图3(c) 的CMC曲线都等于1,这不能提供两个排序列表之间的质量的公平比较。
图3. AP和CMC度量之间差异的一个简单例子。真实匹配和错误匹配分别为绿色和红色。
对于所有三个排序列表,CMC曲线都等于1.但AP分别等于1, 1, 和0.71.
增加了mAP作为评价指标。
相关代码
下载地址