书籍:《21个项目玩转深度学习:基于TensorFlow的实践详解》
人脸检测
FDDB
FDDB是UMass的数据集,被用来做人脸检测(Face Detection)。这个数据集比较大,比较有挑战性。而且作者提供了程序用来评估检测结果,所以在这个数据上面比较算法也相对公平。
-
2845 张图片,其中包含了 5171 张人脸;
-
包含了各种遮挡,高难度的姿态,低分辨率以及对焦模糊的人脸;
-
用椭圆来标定人脸区域;
-
同时包括灰度图和彩色图。
人脸识别
LFW
户外标记人脸数据集LFW (Labeled Face in Wild) 是人脸识别研究领域的最重要人脸图像评测集合之一。
- LFW 人脸图像集合是由美国马萨诸塞大学计算机视觉实验室于2007年发布
- 图像采集自Yahoo! News, 共包括5749个人,13233张图像,其中1680人有两幅及以上的图像
- 大多数图像经由Viola-Jones 人脸检测器得到后,被裁剪为固定大小。由于LFW 中的图像均产生于实际场景,具备自然的光照、表情、姿势和遮挡等干扰因素,且考虑到涉及人物多数为公众人物,也涉及到化妆等更复杂的干扰因素。
因此,在LFW数据集上验证人脸识别算法理论上更贴近实际应用,对实际场景下的人脸识别研究有一定挑战和借鉴意义。
MegaFace
MegaFace 是由华盛顿大学(University of Washington)计算机科学与工程实验室于2015年针对名为 ”MegaFace Challenge” 的挑战而发布并维护的公开人脸数据集,是目前最为权威热门的评价人脸识别性能的指标之一。
- 数据集中的人脸图像均采集自Flickr creative commons dataset,共包含690,572个身份共1,027,060张图像。这是第一个在百万规模级别的人脸识别算法测试标准。
- 在评测方法上,MegaFace 着眼于在百万级别的数据库中的1:N搜索性能。
因此,相比于LFW数据集,MegaFace更贴近实际应用。