zoukankan      html  css  js  c++  java
  • [转] 解决Driver/library version mismatch

    跑模型 torch.cuda.is_available()返回 False 

    nvidia-smi返回:Failed to initialize NVML: Driver/library version mismatch

    查了一下,这篇博文靠谱,留着~

    地址:https://comzyh.com/blog/

    转载内容:

    服务器更新nvidia driver 版本之后,经常会出现

    这个问题出现的原因是kernel mod 的 Nvidia driver 的版本没有更新,一般情况下,重启机器就能够解决,如果因为某些原因不能够重启的话,也有办法reload kernel mod。

    简单来看,就两步

    1. unload nvidia kernel mod
    2. reload nvidia kernel mod

    执行起来就是

    1. sudo rmmod nvidia
    2. sudo nvidia-smi

    nvidia-smi 发现没有 kernel mod 会将其自动装载。

    但是事情远远不是这么简单,一般情况下都会遇到卸载失败。

    这时,就要一点一点的卸载整个驱动了,首先要知道现在kernel mod 的依赖情况,首先我们从错误信息中知道,nvidia_modeset nvidia_uvm 这两个 mod 依赖于 nvidia, 所以要先卸载他们

    可以看到 nvidia 被使用了152词,我们可以先卸载 nvidia_uvm 和 nvidia_modeset

    先查看下有哪些进程使用了 nvidia*

    这些进程有个了解,如果一会卸载失败,记得关闭相关进程。

    卸载

    再 lsof 一遍,如果 nvidia 的使用 Used by 还没有降到 0,kill 相关进程

    最后

    收工

  • 相关阅读:
    BZOJ_2017_[Usaco2009 Nov]硬币游戏_博弈论+DP
    BZOJ_1916_[Usaco2010 Open]冲浪_分层图+拓扑排序+DP
    BZOJ_1915_[Usaco2010 Open]奶牛的跳格子游戏_DP+单调队列
    读入/输出优化模板
    BZOJ_4327_JSOI2012 玄武密码_AC自动机
    计算机网络学习笔记:第六章.应用层
    计算机网络学习笔记:第五章.传输层
    计算机网络学习笔记:第四章.网络层
    计算机网络学习笔记:第三章.数据链路层
    计算机网络学习笔记:第二章.物理层
  • 原文地址:https://www.cnblogs.com/Arborday/p/9636688.html
Copyright © 2011-2022 走看看