我正在我的 ubuntu 18.04 系统上安装 cuda-10.0。我按照官方网站上的说明进行操作:https://docs.nvidia.com/cuda/cuda-installation-guide-linux/
在运行 cuda 工具包提供的示例来验证安装时,出现以下错误:
/usr/local/cuda-10.0/samples/bin/x86_64/linux/release/deviceQuery 正在开始...
CUDA 设备查询(运行时 API)版本(CUDART 静态链接)
cudaGetDeviceCount 返回 35 -> CUDA 驱动程序版本不足以支持 CUDA 运行时版本 结果 = FAIL
我运行了命令“nvidia-smi”并得到以下输出:
无法初始化 NVML:未知错误
以下是命令“dmesg”的输出
[4424407.320909] NVRM:API 不匹配:客户端的版本为 440.82,但 NVRM:此内核模块的版本为 440.44。请确保 NVRM:此内核模块和所有 NVIDIA 驱动程序 NVRM:组件具有相同的版本。
[4426448.420756] NVRM:API 不匹配:客户端的版本为 340.108,但 NVRM:此内核模块的版本为 440.44。请确保 NVRM:此内核模块和所有 NVIDIA 驱动程序 NVRM:组件具有相同的版本。
命令“cat /proc/driver/nvidia/version”的输出
NVRM 版本:NVIDIA UNIX x86_64 内核模块 440.44 2019 年 12 月 8 日星期日 03:38:56 UTC
GCC版本:gcc版本7.4.0(Ubuntu 7.4.0-1ubuntu1~18.04.1)
我正在通过 ssh 和 AnyDesk(通过 GUI 访问)访问远程系统,并安装此软件。有没有不需要我重启远程系统的解决方案。鉴于目前的 Corona 情况,如果我重启远程系统,可能会给我带来麻烦。
答案1
从 Nvidia 网站下载的 .run 文件安装 Nvidia 驱动程序时会发生这种情况。
Ubuntu 有一个libnvidia-compute-4xx
软件包提供了一些库版本(您的情况是 440.82)。. nvidia-smi
run 文件提供的版本需要略有不同的版本(440.44)。解决方案是删除libnvidia-compute-4xx
: # apt purge libnvidia-compute-4xx
。
所有 Nvidia 驱动程序安装指南都会告诉您使用 删除 apt 包# apt remove nvidia*
,但libnvidia-compute-4xx
包逃避了该通配符,导致此库版本不匹配问题。
我通过查看此博客中的命令找到了此解决方案:https://blog.csdn.net/weixin_43825748/article/details/112979312。