zoukankan      html  css  js  c++  java
  • mini_imagenet 数据集生成工具

    最近在看小样本方面的论文,发现这个mini_imagenet这个数据集比较常用,但是却不好找,找了半天也没有找到,最后在找到了这样的答案:

    小样本学习(Few shot learning)标准数据集(miniImageNet、tieredImageNet、Fewshot-CIFAR100)下载地址

    顺着这个线索我又找到了一个miniImageNet数据集生成的工具:

    https://gitee.com/devilmaycry812839668/mini-imagenet-tools

    读了读这个代码,感觉虽然代码质量一般但是可以使用,为了节省时间也就使用这个代码好了。

    个人使用的数据生成命令:

    python mini_imagenet_generator.py --tar_dir ~/ILSVRC2012/ILSVRC2012_img_train.tar

     更多命令参考项目页面。

    通过这个代码才知道原来 miniImageNet的数据集是在ImageNet数据集的基础上进行划分的,换句话说miniImageNet数据集是ImageNet数据集的子集。如果自己想要从头获得这个miniImageNet数据集需要先下载ImageNet数据集,ImageNet数据集的下载方式前文已介绍。

    miniImageNet数据集是在ImageNet数据集(ILSVRC2012_img_train.tar)基础上提取出100个类:

    ['n02110341', 'n01930112', 'n04509417', 'n04067472', 'n04515003', 'n02120079', 'n03924679', 'n02687172', 'n03075370', 'n07747607', 'n09246464', 'n02457408', 'n04418357', 'n03535780', 'n04435653', 'n03207743', 'n04251144', 'n03062245', 'n02174001', 'n07613480', 'n03998194', 'n02074367', 'n04146614', 'n04243546', 'n03854065', 'n03838899', 'n02871525', 'n03544143', 'n02108089', 'n13133613', 'n03676483', 'n03337140', 'n03272010', 'n01770081', 'n09256479', 'n02091244', 'n02116738', 'n04275548', 'n03773504', 'n02606052', 'n03146219', 'n04149813', 'n07697537', 'n02823428', 'n02089867', 'n03017168', 'n01704323', 'n01532829', 'n03047690', 'n03775546', 'n01843383', 'n02971356', 'n13054560', 'n02108551', 'n02101006', 'n03417042', 'n04612504', 'n01558993', 'n04522168', 'n02795169', 'n06794110', 'n01855672', 'n04258138', 'n02110063', 'n07584110', 'n02091831', 'n03584254', 'n03888605', 'n02113712', 'n03980874', 'n02219486', 'n02138441', 'n02165456', 'n02108915', 'n03770439', 'n01981276', 'n03220513', 'n02099601', 'n02747177', 'n01749939', 'n03476684', 'n02105505', 'n02950826', 'n04389033', 'n03347037', 'n02966193', 'n03127925', 'n03400231', 'n04296562', 'n03527444', 'n04443257', 'n02443484', 'n02114548', 'n04604644', 'n01910747', 'n04596742', 'n02111277', 'n03908618', 'n02129165', 'n02981792']

    然后再对这100个类中的数据进行划分,分别划分为train、  test、  val 部分:

    现在比较常用的两种划分:https://gitee.com/devilmaycry812839668/mini-imagenet-tools/tree/main/mini_imagenet_split

     该工具默认使用   Ravi   的划分。

    train划分为64个类,

    test 划分为20个类:

    val 划分为16个类:

     默认 miniImageNet数据集是对ImageNet数据集中的图片进行了84x84的resize操作的。

    ==================================================

     运行   mini_imagenet_generator.py  文件后文件夹内容如下:

    其中  imagenet   mini_imagenet  均为中间过程文件夹,  processed_images 为最终数据集文件夹。

    =================================================

    gitee 下载地址:

    https://gitee.com/devilmaycry812839668/mini-imagenet-tools

    github 下载地址:

    https://github.com/yaoyao-liu/mini-imagenet-tools

    =================================================

    本博客是博主个人学习时的一些记录,不保证是为原创,个别文章加入了转载的源地址还有个别文章是汇总网上多份资料所成,在这之中也必有疏漏未加标注者,如有侵权请与博主联系。
  • 相关阅读:
    ESP32学习目录
    python中mysql管理模块mysql-connector使用
    MYSQL基础知识和操作
    urlib补充
    Python3中Urllib库是什么?urllib模块基本使用
    递归:斐波契那数列
    python正则模块一
    模块&包
    XML模块示例代码
    使用python操作XML增删改查
  • 原文地址:https://www.cnblogs.com/devilmaycry812839668/p/15643421.html
Copyright © 2011-2022 走看看