英伟达驱动版本是384.130
显示的NVRM version: NVIDIA UNIX x86_64 Kernel Module是:384.130。 若是旧的版本就会出现如下问题。
这个问题出现的原因是kernel mod 的 Nvidia driver 的版本没有更新,一般情况下,重启机器就能够解决,如果因为某些原因不能够重启的话,也有办法reload kernel mod。
方法如下:
就两步
- unload nvidia kernel mod
- reload nvidia kernel mod
执行
-
sudo rmmod nvidia
-
sudo nvidia-smi
若出现问题
-
$ sudo rmmod nvidia
-
rmmod: ERROR: Module nvidia is in use by: nvidia_modeset nvidia_uvm
这时,就要一点一点的卸载整个驱动了,首先要知道现在kernel mod 的依赖情况,首先我们从错误信息中知道,nvidia_modeset nvidia_uvm 这两个 mod 依赖于 nvidia, 所以要先卸载他们
先查看下有哪些进程使用了 nvidia*
```
sudo fuser -v /dev/nvidia* #查找占用GPU资源的PID
sudo lsof -n -w /dev/nvidia* #查找占用GPU资源的PID
```
这些进程有个了解,如果一会卸载失败,记得关闭相关进程。
卸载
-
sudo rmmod nvidia_uvm
-
sudo rmmod nvidia_modeset
#参考文献