zoukankan      html  css  js  c++  java
  • 制作新的train,test数据集

    之前的数据集的train和test是直接按照网上下载的数据的前7000个作为训练集,后2212个作为测试集。看得出来,这个数据集是由开车录制视频转换来的图片数据,后面2000多个图片的场景和前面的场景不太一样。所以将整个数据集随机打乱,随机分配7000个训练集和2212个测试集。下面是代码:

    import random
    import os
    
    image_index = []
    
    with open('/home/bnrc/all_image_index.txt','r') as f:
        for line in f:
            line = line[:-1]
            image_index.append(line)
    
    random.shuffle(image_index)   
    for x in image_index:
        print x
    
    # print len(image_index)
    
    
    for i in range(7000):
        os.system('cp /home/bnrc/all_image/%s /home/bnrc/new_train/'%image_index[i])              #使用os模块,system是直接向终端输入命令。这里还有一个%s格式化输入
    
    for j in range(7000,9212):
        os.system('cp /home/bnrc/all_image/%s /home/bnrc/new_test/'%image_index[j])
    
    # os.system('pwd')

    先按照顺序把所有图片名字存一个list,然后把list打乱,再把打乱的前7000个作为训练集,后面2000多个作为测试集。

    os.system:运行shell命令,注意:这里是打开一个新的shell,运行命令,当命令结束后,关闭shell

  • 相关阅读:
    生物创新科技素养大赛小车代码
    对拍程序
    Link-Cut-Tree学习笔记
    可平面性判定,任意平面图判定(代码实现)
    强联通缩点拓扑排序去重边小技巧
    20200405~06题解
    数论总结
    20200328题解
    Dp优化总结
    20200314题解
  • 原文地址:https://www.cnblogs.com/ymjyqsx/p/7397072.html
Copyright © 2011-2022 走看看