PyTorch提供了一种将数据包装起来进行批训练的工具——DataLoader。使用的时候,只需要将我们的数据首先转换为torch的tensor形式,再转换成torch可以识别的Dataset格式,然后将Dataset放入DataLoader中就可以啦。
TensorDataset
classtorch.utils.data.TensorDataset(data_tensor,target_tensor)
TensorDataset类用来将样本及其标签打包成torch的Dataset,data_tensor,和target_tensor都是tensor。
DataLoaderwww.weixiu3721.com
classtorch.utils.data.DataLoader(dataset,batch_size=1,shuffle=False,sampler=None,num_workers=0,collate_fn=<function default_collate>,pin_memory=False,drop_last=False)
dataset就是Torch的Dataset格式的对象;batch_size即每批训练的样本数量,默认为;shuffle表示是否需要随机取样本;num_workers表示读取样本的线程数。