官方文档链接地址(https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/install-guide.html#docker)
(1)平台要求
运行 NVIDIA 容器工具包的先决条件列表如下所述:
GNU/Linux x86_64版本 > 3.10 ;
Docker >= 19.03(建议,但某些发行版可能包含 Docker 的较旧版本。支持的最低版本为 1.12);
NVIDIA GPU 具有架构 > Fermi (或计算能力 2.1);
NVIDIA 驱动程序= 361.93 (未在旧版本上测试)。
(2)设置 Docker
可以使用 Docker 的官方便利脚本设置 Ubuntu 上的 Docker-CE:
curl https://get.docker.com | sh && sudo systemctl start docker && sudo systemctl enable docker
(3)设置存储库和 GPG 密钥:stable
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) && curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - && curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
(4)更新包列表后安装包(和依赖项):nvidia-docker2
sudo apt-get update sudo apt-get install -y nvidia-docker2
可能出现如下错误提示:
正在读取软件包列表... 完成
正在分析软件包的依赖关系树
正在读取状态信息... 完成
E: 无法定位软件包 nvidia-docker2
解决办法:
sudo vim /etc/hosts
打开ipaddress,搜索查找nvidia.github.io,即可得到对应的ip地址:
在打开的hosts文件尾部追加:
# nvidia.github.io 185.199.108.153 nvidia.github.io 185.199.109.153 nvidia.github.io 185.199.110.153 nvidia.github.io 185.199.111.153 nvidia.github.io
保存退出即可。
重新执行(3)和(4)的全部操作,正确的运行结果如下图。
在设置默认运行时后重新启动 Docker 守护程序以完成安装:
sudo systemctl restart docker
此时,可以通过运行基本 CUDA 容器来测试工作设置:
sudo docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi
打印出nvidia-smi的信息证明安装成功