宿主机需要安装的软件:
所有带gpu的节点都需要安装
- gpu驱动程序
- nvidia-docker2
容器中需要安装的软件:
cuda和cudnn可以到dockerhub上找到需要使用的版本及操作系统版本对应的镜像,然后基于该镜像重新构建即可,注意的是官方镜像是不包含python的,需要自己安装底层库和python版本
- cuda
- cudnn
- docker pull nvidia/cuda:10.0-cudnn7-devel-centos7
- cuda版本 cudnn版本 os
kube-system中需要安装的程序:
- nvidia-device-plugin
参考:https://kubernetes.io/zh/docs/tasks/manage-gpus/scheduling-gpus/