Ubuntu 16.04 + GTX 1080 Ti + CUDA 9.0 + Cudnn 7.1 安装配置
1. 安装显卡驱动
首先查看一下自己的电脑需要怎样的驱动,我们可以先到 http://www.nvidia.com/Download/index.aspx 查询下我们需要的是怎样的驱动,这里我的显卡是 GTX 1080 Ti,所以以此为例说明,勾选好对应的配置:
点击search并下载驱动
打开terminal,卸掉系统原有驱动:
sudo apt-get remove --purge nvidia*
在安装新驱动前,禁用nouveau:
在终端中运行 lsmod | grep nouveau
若没有输出则nouveau已禁用;若有输出则说明nouveau正在运行,需要手动禁用:
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
在该文件尾部输入以下内容:
blacklist nouveau
options nouveau modeset=0
保存并关闭文件。
在终端中执行:sudo update-initramfs -u
再次运行 lsmod | grep nouveau 检查nouveau是否禁用,若未禁用则重复上述操作。
关闭图形化界面:sudo service lightdm stop
按Ctrl + Alt + F1 进入字符终端页面,
进入驱动所在的目录,运行:
sudo sh 驱动名
安装完之后重启: sudo reboot
打开终端输入命令: nvidia-smi, nvidia-settings查看驱动安装状态:
2. 安装CUDA 9.0
sudo sh cuda_9.0.176_384.81_linux.run
是否Accept EULA:Accpet
Install driver:Yes/No
Install OpenGL:No
Run nvidia_xconfig: No
Install Cuda Toolkit: Yes
Yes
Yes
配置CUDA的环境变量:
sudo gedit ~/.bashrc
在文件尾部输入:
- export LD_LIBRARY_PATH=/usr/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH
- export LD_LIBRARY_PATH=/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH
运行source ~/.bashrc 使其生效
3. 配置 Cudnn
下载Cudnn并解压:
tar -zxvf cudnn-7.0-linux-x64-v3.0-prod.tgz
解压后会看到一个cuda文件夹,里面包含了include以及lib64两个子目录。我们需要做的就是将这两个字母里面的文件复制到cuda对应的安装目录。这里以cuda的安装目录为/usr/local/cuda/,这个目录下也会包含include/以及lib64/这两个文件夹,将之前目录的文件复制过来即可。
sudo cp cuDNN/cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuDNN/cuda/lib64/* /usr/local/cuda/lib64/
这时候本来已经可以了,但是由于权限的原因原来的两个符号链接文件(libcudnn.so,libcudnn.so.7.0)已经失效了,直接编译便会报错,所以这时手动生成符号链接。
#下面的操作在/usr/local/cuda/lib64/目录下进行
sudo rm -rf libcudnn.so libcudnn.so.7.0#删除两个符号链接;
sudo ln -s libcudnn.so.7.0.64 libcudnn.so.7.0
sudo ln -s libcudnn.so.7.0 libcudnn.so
运行source ~/.bashrc 使其生效
如果出现下面问题:
/sbin/ldconfig.real: /usr/local/cuda/lib64/libcudnn.so.7 is not a symbolic link
则参考如下解决方法,版本需对应安装的cudnn的相应版本(link:https://askubuntu.com/questions/1025928/why-do-i-get-sbin-ldconfig-real-usr-local-cuda-lib64-libcudnn-so-7-is-not-a):
sudo rm libcudnn.so
sudo ln libcudnn.so.7.0.5 libcudnn.so.7
sudo ln libcudnn.so.7 libcudnn.so
sudo ldconfig
Cudnn配置完毕
4. 安装Anaconda
根据环境下载对应的anaconda 软件,运行:
Sudo bash Anaconda3-5.1.0-Linux-x86_64.sh
安装完之后创建python虚拟环境:
conda create -n tensorflow pip python=2.7 # or python=3.3, etc.
(根据需要选择合适的python版本)
5. 安装Tensorflow-gpu
输入命令:source activate tensorflow-gpu
pip install --ignore-installed --upgrade tfBinaryURL
(我装的是tensorflow-gpu 1.10版本,把tfBinaryURL 替换如下
https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-1.10.0-cp36-cp36m-linux_x86_64.whl )
链接不好使~需要多试几次,tensorflow会自动下载安装
6. 缺少的一些包用pip安装:
Pip install opencv-python
Pip install matplotlib, etc