关于机器学习所需要的测试数据集合
Kaggle网址(用的最多):https://www.kaggle.com/datasets
UCI数据集网址(其次): http://archive.ics.uci.edu/ml/
scikit-learn网址(最少):http://scikit-learn.org/stable/datasets/index.html#datasets
训练数据
1、计算机视觉
(1)人脸数据:
A、香港中文大学训练数据集:http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html
此数据库包含了20w张人脸图片,每张图片标注了5个特征点、以及几十种属性(是否微笑、肤色、发色、性别等属性)
B、68个人脸特征点:http://ibug.doc.ic.ac.uk/resources/facial-point-annotations/
此网站差不多可以下载到3000张,训练数据图片,每张图片标注了68个人脸特征点
C、74个人脸特征点:http://gaps-zju.org/DDE/
这个网站包好了1.4w张的人脸训练数据图片,每张图片标注了74个人脸特征点。不过这个数据感觉标注的很不精确
D、性别与年龄训练数据:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/
这个网站包含了500k+的人脸性别与年龄训练数据,同时还有文献及代码,对于搞性别年龄预测,资源充足
(2)深度估计、图像分割:
A、RGBD训练数据列表:http://www0.cs.ucl.ac.uk/staff/M.Firman/RGBDdatasets/
2、自然语言