由于毕业设计的原因,搞了很长时间的深度学习环境配置,刚开始没有老师的服务器,先在自己的win10电脑上配置了一下,用了anaconda,下载了自己需要的python版本,然后下载了tensorflow(换了好几种版本,最后才成功);然后听说阿里云可以领取免费的服务器,又在服务器上搞了很长时间,在这上面,接触到了docker(太强大了),可以建立自己的容器,也可以在docker hub上查看别人共享的,自己建立自己的容器后可以上传,然后就可以一直用这个环境了,解决了换了服务器后,环境重新配的困扰;之后老师的服务器到手,新建立了自己需要的深度学习环境,在这写一些个人的一些经验。
首先自己要搞清楚你要配的环境是整台电脑的还是只想配一个虚拟环境,个人不推荐整台电脑的深度学习环境,一般来说,第一次配,各种版本之间的联系都不清楚,最好是建立自己的虚拟环境,当出问题的时候,可以创建另一个虚拟环境,并且两个虚拟环境相互之间是没有影响的,如果创建的是整台电脑的环境,windows电脑卸载是比较麻烦的,linux另当别论。
(1)在win10电脑上,下载anaconda还是比较简单的,网上有很多的教程,下载之后,就可以建立自己的深度学习环境了,可以使用conda create命令建立自己的一个虚拟环境,使用conda activate命令激活自己的虚拟环境,(注意此时是有变化的)此时就可以进入自己的虚拟环境了,配置自己所需要的深度学习环境。(conda的命令网上百度可以找到)
下面是我之前建立的虚拟环境:
下面是我用的pycharm里激活环境的界面,可以看到由原来的base环境切换到了tf3环境;
(2)下载的python版本,3.5的就算比较老的了,我使用过3.6、3.7、3.8版本的,这个的需求根据自己来决定,安装python的方法步骤网上也很多。
(3)安装tensorflow的时候,目前网上1.0版本左右的问题解决方案比较多,2.0以上的遇到了问题解决方案比较少,之前就用了2.0以上版本的,遇到了一个问题,到现在都没解决。还要注意如果你要安装GPU版本的,还要考虑跟CUDA对应的问题,下面是我随便找的一个博客,里面有对应关系:
https://blog.csdn.net/qq_27825451/article/details/89082978
否则如果你的版本对应关系不对,可能出现这样的问题:ImportError: libcudnn.so.X: cannot open shared objectfile: No such file or directory
(4)docker可以解决你在一台电脑上配置了一个比较复杂的环境,然后在另一台电脑也需要这个环境的时候,可以直接通过docker hub 下载自己原来电脑的环境,避免了重复环境的困扰,下面是我使用docker的指导文件:
https://blog.csdn.net/b9567/article/details/105027440/
(5)如果你没有GPU服务器,然后资金不是很充足的时候,可以用Google colab,它是免费的,虽然速度不是很快,但还可以接受,如何使用Google colab教程也很多,以下是一些使用GPU运行深度学习代码的常用命令:
测试GPU版本:!nvidia-smi
挂载自己云盘:from google.colab import drive
drive.mount('/content/gdrive')
import os
os.chdir("/content/gdrive/My Drive/Colab Notebooks/keras-yolo3-master")(自己路径)
里面有两个版本的tensorflow,默认开启2.0的,如果需要更改任意的可以使用如下代码:
! pip install tensorflow-gpu==2.x
也可以直接启用1.0版本的:
%tensorflow_version 1.x
import tensorflow as tf
tf.__version__
安装keras:
!sudo pip install Keras==2.1.5(先执行这一个,后重启,在更改tensorflow版本)(注意顺序)
(6)使用了老师的服务器,体验了一下GPU运行深度学习代码,那是真的爽啊,速度太顶了,linux配置深度学习环境比较简单,下载tensorflow,如果版本不对,直接uninstall,重新下载另一个版本就可以了。
以上便是之前的一些小收获,暂时想起来这么多,有问题欢迎交流。