升级nvidia驱动程序
-
先卸载之前的驱动程序
https://blog.csdn.net/Aaron_qinfeng/article/details/106939938
按照方法二进行操作
yum remove nvidia-* # 清除所有nvidia相关文件和依赖 #进一步清除 rpm -qa|grep -i nvid|sort yum remove kmod-nvidia-* #重启 sudo reboot
-
然后按照 https://blog.csdn.net/alex_my/article/details/44705663 进行安装即可
-
下载驱动:nvidia官网:https://www.nvidia.com/Download/Find.aspx
-
屏蔽默认带有的nouveau
- 使用su命令切换到root用户下: su root
- 打开/lib/modprobe.d/dist-blacklist.conf
- 将nvidiafb注释掉。
#blacklist nvidiafb - 然后添加以下语句:
blacklist nouveau
options nouveau modeset=0
-
重建initramfs image步骤(这是两行命令)
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak dracut /boot/initramfs-$(uname -r).img $(uname -r)
-
修改运行级别为文本模式
systemctl set-default multi-user.target
-
重新启动, 使用root用户登陆
reboot
-
查看nouveau是否已经禁用
lsmod | grep nouveau
-
进入下载的驱动所在目录
chmod +x NVIDIA-Linux-x86_64-346.47.run ./NVIDIA-Linux-x86_64-346.47.run
安装过程中,选择accept
如果提示要修改xorg.conf,选择yes -
修改运行级别回图形模式
systemctl set-default graphical.target
-
Nvidia Docker安装后,使用镜像创建容器时出错,错误提示:
Error response from daemon: could not select device driver "" with capabilities: [[gpu]]
需要安装:NVIDIA Container Toolkit
解决:https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/install-guide.html#docker