nvidia-smi:内核 API 版本不匹配

nvidia-smi:内核 API 版本不匹配

我正在我的 ubuntu 18.04 系统上安装 cuda-10.0。我按照官方网站上的说明进行操作:https://docs.nvidia.com/cuda/cuda-installation-guide-linux/

在运行 cuda 工具包提供的示例来验证安装时,出现以下错误:

/usr/local/cuda-10.0/samples/bin/x86_64/linux/release/deviceQuery 正在开始...

CUDA 设备查询(运行时 API)版本(CUDART 静态链接)

cudaGetDeviceCount 返回 35 -> CUDA 驱动程序版本不足以支持 CUDA 运行时版本 结果 = FAIL

我运行了命令“nvidia-smi”并得到以下输出:

无法初始化 NVML:未知错误

以下是命令“dmesg”的输出

[4424407.320909] NVRM:API 不匹配:客户端的版本为 440.82,但 NVRM:此内核模块的版本为 440.44。请确保 NVRM:此内核模块和所有 NVIDIA 驱动程序 NVRM:组件具有相同的版本。

[4426448.420756] NVRM:API 不匹配:客户端的版本为 340.108,但 NVRM:此内核模块的版本为 440.44。请确保 NVRM:此内核模块和所有 NVIDIA 驱动程序 NVRM:组件具有相同的版本。

命令“cat /proc/driver/nvidia/version”的输出

NVRM 版本:NVIDIA UNIX x86_64 内核模块 440.44 2019 年 12 月 8 日星期日 03:38:56 UTC

GCC版本:gcc版本7.4.0(Ubuntu 7.4.0-1ubuntu1~18.04.1)

我正在通过 ssh 和 AnyDesk(通过 GUI 访问)访问远程系统,并安装此软件。有没有不需要我重启远程系统的解决方案。鉴于目前的 Corona 情况,如果我重启远程系统,可能会给我带来麻烦。

答案1

从 Nvidia 网站下载的 .run 文件安装 Nvidia 驱动程序时会发生这种情况。

Ubuntu 有一个libnvidia-compute-4xx软件包提供了一些库版本(您的情况是 440.82)。. nvidia-smirun 文件提供的版本需要略有不同的版本(440.44)。解决方案是删除libnvidia-compute-4xx: # apt purge libnvidia-compute-4xx

所有 Nvidia 驱动程序安装指南都会告诉您使用 删除 apt 包# apt remove nvidia*,但libnvidia-compute-4xx包逃避了该通配符,导致此库版本不匹配问题。

我通过查看此博客中的命令找到了此解决方案:https://blog.csdn.net/weixin_43825748/article/details/112979312

相关内容