zoukankan      html  css  js  c++  java
  • 莫烦PyTorch学习笔记(六)——批处理

    1.要点
    Torch 中提供了一种帮你整理你的数据结构的好东西, 叫做 DataLoader, 我们能用它来包装自己的数据, 进行批训练. 而且批训练可以有很多种途径。
    2.DataLoader
    DataLoader 是 torch 给你用来包装你的数据的工具. 所以你要讲自己的 (numpy array 或其他) 数据形式装换成 Tensor, 然后再放进这个包装器中. 使用 DataLoader 有什么好处呢? 就是他们帮你有效地迭代数据, 举例:
    import torch
    
    import torch.utils.data as Data
    
    
    BATCH_SIZE = 5  # 批训练的数据个数,每组五个
    
    x = torch.linspace(1, 10, 10)  # x data (torch tensor)
    
    y = torch.linspace(10, 1, 10)  # y data (torch tensor)
    
    # 先转换成 torch 能识别的 Dataset
    
    torch_dataset = Data.TensorDataset(x,y)
    
    # 把 dataset 放入 DataLoader
    
    loader = Data.DataLoader(
    
        dataset=torch_dataset,  # torch TensorDataset format
    
        batch_size=BATCH_SIZE,  # 每组的大小
    
        shuffle=True,  # 要不要打乱数据 (打乱比较好)
    
    )
    
    for epoch in range(3):  # 对整套数据训练三次,每次训练的顺序可以不同
    
        for step, (x, y) in enumerate(loader):  # 每一步 loader 释放一小批数据用来学习
    
            # 假设这里就是你训练的地方...
    
            # 打出来一些数据
    
            print('Epoch: ', epoch, '| Step: ', step, '| batch x: ',
    
                 x.numpy(), '| batch y: ', y.numpy())

    通过批处理计算可以加快训练的速度

    Python中enumerate用法详解

  • 相关阅读:
    LeetCode 12. 整数转罗马数字
    [Python] for in range()使用以及列表字符串反转方法
    组合数问题
    「BJOI2020」封印
    数据结构优化建图
    小Q与找茬
    无旋Treap学习
    jzoj5679
    数星星
    凸性
  • 原文地址:https://www.cnblogs.com/henuliulei/p/11370576.html
Copyright © 2011-2022 走看看