zoukankan      html  css  js  c++  java
  • 公开数据集

    Dataset

     

     

     

    图像分类

    1. Imagenet官网https://image-net.org/download.php   https://www.kaggle.com/c/imagenet-object-localization-challenge/data

                            下载https://cloud.google.com/tpu/docs/imagenet-setup?hl=zh-cn

                            介绍:https://lonepatient.top/2018/07/01/Deep_Learning_For_Computer_Vision_With_Python_PB_13.html

    Imagenet

    完整版本:

    21,841类别(synsets)

    14,197,122张图片

     

    WordNet:英语字典,ImageNet数据集是根据WordNet IDs映射的;

    synset(同义词集合):WordNet根据词条的意义将它们分组,每一个具有相同意义的字条组称为一个synset;

      

    子数据集:ILSVRC(ImageNet的一个子集),大约120万个训练图像,5万个验证图像,以及10万个测试图像;

    1000类别标记(train中每类732—1300张图片,val中每类50张图像,test中每类100张图像)

     

    ILSVRC数据集结构介绍:

    • Annotations:物体位置标注数据文件,一般是在物体检测任务中使用到,目前我们可以忽略这个数据集
    • Data:数据文件夹,这个是我们需要重点关注的,里面包含了train、val和test原始图像数据
    • ImageSets:图像对应的属性信息,主要存放的是标签的映射关系数据(train_cls.txt、val.txt)

    train目录:如WordNet ID为n01440764的子目录包含了1300张 “tench(欧洲淡水鱼)”图像

    Val目录:所有图像都放在一个文件夹中(在val.txt文件中,提供了val数据集文件名到类标签的映射关系)

    test目录:保密的,没有标签信息

      

    “黑名单”图像——由ImageNet数据集管理员标记为“黑名单”的图像,由于该图像的类标签过于模糊,因此在评估过程中我们不考虑这些图像;

    devkit(ILSVRC2016_devkit.tar.gz):包含实际的索引文件、validation数据中黑名单图像id和图像文件名映射到相应的实际类标签等数据;

    data目录:

    • map_clsloc.txt:包含WordNet ID映射到图像真实的类标签数据
    • ILSVRC2015_clsloc_validation_ground_truth.txt
    • ILSVRC2015_clsloc_validation_blacklist.txt

     

    2. 人像:https://www.kaggle.com/laurentmih/aisegmentcom-matting-human-datasets

    3. Caltech 101:101个类别,每类约40-800张图片(102类,包括一个杂乱类),大部分类别有50张图片(300*200),共计9145张图片;

    4. Caltech 256:Caltech 101数据集改进,257个类别(包含一个杂乱类),每类约80-827张图片,共计30607张;

    5. Cifar10:10类(飞机,汽车,鸟,猫,鹿,狗,青蛙,马,船,卡车),每类6000张图片(32*32),共计6W张;

    6. Cifar100:100个类别(分入20个一级类),每个子类600张图片(32*32),共计6W张;https://www.kaggle.com/aymenboulila2/cifar100 

    超类

    子类

    水生哺乳动物

    海狸,海豚,水獭,海豹,鲸鱼

    水族馆鱼,比目鱼,雷,鲨鱼,鳟鱼

    花卉

    兰花,罂粟,玫瑰,向日葵,郁金香

    食品容器

    瓶子,碗,罐,杯子,盘子

    水果和蔬菜

    苹果,蘑菇,橘子,梨,甜椒

    家用电器

    时钟,电脑键盘,灯,电话,电视

    家用家具

    床,椅子,沙发,桌子,衣柜

    昆虫

    蜜蜂,甲虫,蝴蝶,毛毛虫,蟑螂

    大食肉动物

    熊,豹,狮子,老虎,狼

    大型人造户外用品

    桥梁,城堡,房屋,道路,摩天大楼

    大型自然户外场景

    云,森林,山,平原,海洋

    大型杂食动物和食草动物

    骆驼,牛,黑猩猩,大象,袋鼠

    中型哺乳动物

    狐狸,豪猪,负鼠,浣熊,臭鼬

    非昆虫无脊椎动物

    螃蟹,龙虾,蜗牛,蜘蛛,蠕虫

    人们

    婴儿,男孩,女孩,男人,女人

    爬虫类

    鳄鱼,恐龙,蜥蜴,蛇,乌龟

    小哺乳动物

    仓鼠,鼠标,兔子,rabbit,松鼠

    树木

    枫木,橡木,棕榈,松木,柳树

    车辆1

    自行车,公共汽车,摩托车,皮卡车,火车

    车辆2

    割草机,火箭,电车,坦克,拖拉机

     

     

     

    目标检测

    1. Coco官网:https://cocodataset.org/#home

               介绍:https://arleyzhang.github.io/articles/e5b86f16/

    2. PASCAL VOC官网:http://host.robots.ox.ac.uk/pascal/VOC/

                           介绍:图片集包括20个目录:人类;动物(鸟、猫、牛、狗、马、羊);交通工具(飞机、自行车、船、公共汽车、小轿车、摩托车、火车);室内(瓶子、椅子、餐桌、盆栽植物、沙发、电视  https://arleyzhang.github.io/articles/1dc20586/

     

     

     

     

     

     

     

     

     

     

     

     

     

  • 相关阅读:
    sort函数详解
    C++重载运算符的规则详解
    poj3061-subsequence
    员工管理系统 :练习
    Jdbc 模拟登陆系统的练习
    有关String 的常用方法
    浅谈希尔排序-----摘录
    简单选择排序
    typedef 和define 的区别
    写博客的理由
  • 原文地址:https://www.cnblogs.com/xiaowa/p/15321295.html
Copyright © 2011-2022 走看看