1.什么是Pytorch,为什么选择Pytroch?
因为PyTorch是当前难得的简洁优雅且高效快速的框架。在笔者眼里,PyTorch达到目前深度学习框架的最高水平。当前开源的框架中,没有哪一个框架能够在灵活性、易用性、速度这三个方面有两个能同时超过PyTorch。下面是许多研究人员选择PyTorch的原因。
• 简洁:PyTorch的设计追求最少的封装,尽量避免重复造轮子。不像TensorFlow中充斥着session、graph、operation、name_scope、variable、tensor、layer等全新的概念,PyTorch的设计遵循 tensor→variable(autograd)→nn.Module 三个由低到高的抽象层次,分别代表高维数组(张量)、自动求导(变量)和神经网络(层/模块),而且这三个抽象之间联系紧密,可以同时进行修改和操作。
简洁的设计带来的另外一个好处就是代码易于理解。PyTorch的源码只有TensorFlow的十分之一左右,更少的抽象、更直观的设计使得PyTorch的源码十分易于阅读。在笔者眼里,PyTorch的源码甚至比许多框架的文档更容易理解。
• 速度:PyTorch的灵活性不以速度为代价,在许多评测中,PyTorch的速度表现胜过TensorFlow和Keras等框架 。框架的运行速度和程序员的编码水平有极大关系,但同样的算法,使用PyTorch实现的那个更有可能快过用其他框架实现的。
• 易用:PyTorch是所有的框架中面向对象设计的最优雅的一个。PyTorch的面向对象的接口设计来源于Torch,而Torch的接口设计以灵活易用而著称,Keras作者最初就是受Torch的启发才开发了Keras。PyTorch继承了Torch的衣钵,尤其是API的设计和模块的接口都与Torch高度一致。PyTorch的设计最符合人们的思维,它让用户尽可能地专注于实现自己的想法,即所思即所得,不需要考虑太多关于框架本身的束缚。
• 活跃的社区:PyTorch提供了完整的文档,循序渐进的指南,作者亲自维护的论坛 供用户交流和求教问题。Facebook 人工智能研究院对PyTorch提供了强力支持,作为当今排名前三的深度学习研究机构,FAIR的支持足以确保PyTorch获得持续的开发更新,不至于像许多由个人开发的框架那样昙花一现。
在PyTorch推出不到一年的时间内,各类深度学习问题都有利用PyTorch实现的解决方案在GitHub上开源。同时也有许多新发表的论文采用PyTorch作为论文实现的工具,PyTorch正在受到越来越多人的追捧 。作为论文实现的工具,PyTorch正在受到越来越多人的追捧 。如果说 TensorFlow的设计是“Make It Complicated”,Keras的设计是“Make It Complicated And Hide It”,那么PyTorch的设计真正做到了“Keep it Simple,Stupid”。简洁即是美。使用TensorFlow能找到很多别人的代码,使用PyTorch能轻松实现自己的想法。
2.Pytroch的安装
pip3 install http://download.pytorch.org/whl/cpu/torch-0.4.1-cp36-cp36m-win_amd64.whl
安装好后Pytorch后,还有个torchvision安装,这个主要集成了一些数据集,深度学习模型,一些转换等,以后需要使用还是很方便的。
pip3 install torchvision
3、测试安装
进入Python环境测试安装的包是否成功,如下图所示。import torch导入没报错就说明安装成功,torch.cuda.is_available()是True就表示支持GPU啦~
4.PyTorch基础概念
Tensor(张量)
Tensors与Numpy中的 ndarrays类似,但是在PyTorch中 Tensors可以使用GPU进行计算。
Tensor是神经网络框架中重要的基础数据类型,可以简单理解为N维数组的容器对象。Tensor之间的通过运算进行连接,从而形成计算图。
自动求导
PyTorch 中所有神经网络的核心是 autograd 包。
autograd包为张量上的所有操作提供了自动求导。 它是一个在运行时定义的框架,这意味着反向传播是根据你的代码来确定如何运行,并且每次迭代可以是不同的。
神经网络
torch.nn模块提供了创建神经网络的基础构件,这些层都继承自Module类。当实现神经网络时需要继承自此模块,并在初始化函数中创建网络需要包含的层,并实现forward函数完成前向计算,网络的反向计算会由自动求导机制处理。
5.通用代码实现流程(实现一个深度学习的代码流程)
手写数字识别
import torch import torch.nn as nn from torch.autograd import Variable import torch.utils.data as Data import torchvision import matplotlib.pyplot as plt %matplotlib inline
torch.manual_seed(1) EPORCH=1 BATCH_SIZE=50 LR=0.001 DOWNLOAD_MNIST = False
train_data = torchvision.datasets.MNIST( root='./mnist/', train=True,#this is train data, transform=torchvision.transforms.ToTensor(), download=DOWNLOAD_MNIST, )
print(train_data.train_data.size()) print(train_data.train_labels.size()) plt.imshow(train_data.train_data[0].numpy(),cmap='gray') plt.title('%i'%train_data.train_labels[0]) plt.show()
1 train_loader=Data.DataLoader(dataset=train_data,batch_size=BATCH_SIZE,shuffle=True) 2 test_data = torchvision.datasets.MNIST(root='./mnist',train=False) 3 test_x = Variable(torch.unsqueeze(test_data.test_data,dim=1)).type(torch.FloatTensor)[:2000]/255 4 test_y = test_data.test_labels[:2000]
1 class CNN(nn.Module): 2 def __init__(self): 3 super(CNN,self).__init__() 4 self.conv1=nn.Sequential( 5 nn.Conv2d( 6 in_channels=1, 7 out_channels=16, 8 kernel_size=5, 9 stride=1, 10 padding=2, 11 ), 12 nn.ReLU(), 13 nn.MaxPool2d(kernel_size=2), 14 ) 15 self.conv2=nn.Sequential( 16 nn.Conv2d(16,32,5,1,2), 17 nn.ReLU(), 18 nn.MaxPool2d(2), 19 ) 20 self.out=nn.Linear(32*7*7,10) #fully connected layer,output10 classes 21 def forward(self,x): 22 x = self.conv1(x) 23 x = self.conv2(x) 24 x = x.view(x.size(0),-1) 25 output = self.out(x) 26 return output
1 cnn = CNN() 2 print(cnn)
optimizer = torch.optim.Adam(cnn.parameters(),lr=LR) #optimize all cnn parameters loss_func = nn.CrossEntropyLoss()
1 from matplotlib import cm 2 # try: from sklearn.manifold import TSNE; HAS_SK = True 3 # except: HAS_SK = False; print('Please install sklearn for layer visualization') 4 # def plot_with_labels(lowDWeights, labels): 5 # plt.cla() 6 # X, Y = lowDWeights[:, 0], lowDWeights[:, 1] 7 # for x, y, s in zip(X, Y, labels): 8 # c = cm.rainbow(int(255 * s / 9)); plt.text(x, y, s, backgroundcolor=c, fontsize=9) 9 # plt.xlim(X.min(), X.max()); plt.ylim(Y.min(), Y.max()); plt.title('Visualize last layer'); plt.show(); plt.pause(0.01) 10 11 # plt.ion() 12 for epoch in range(EPORCH): 13 for step ,(x,y) in enumerate(train_loader): 14 b_x = Variable(x) 15 b_y = Variable(y) 16 17 output=cnn(b_x) 18 loss = loss_func(output,b_y) 19 optimizer.zero_grad() 20 loss.backward() 21 optimizer.step() 22 if step % 50 == 0: 23 test_output = cnn(test_x) 24 pred_y = torch.max(test_output,1)[1].data.squeeze() 25 accuracy = (pred_y == test_y).sum().item() / test_y.size(0) 26 print('Epoch: ',epoch,'| train loss: %.4f'%loss.item(),'|test accuracy: %.2f'%accuracy) 27 test_output = cnn(test_x[:10]) 28 pred_y = torch.max(test_output,1)[1].data.numpy().squeeze() 29 print(pred_y,'prediction number') 30 print(test_y[:10].numpy(),'real number')
参考:https://blog.csdn.net/qingxuanmingye/article/details/90138744
https://blog.csdn.net/broadview2006/article/details/79147351