安装 nvidia 驱动程序后,nvidia-smi引发此错误:
modprobe:错误:无法插入“nvidia_384”:执行格式错误
NVIDIA-SMI 失败,因为它无法与 NVIDIA 驱动程序通信。请确保已安装并运行最新的 NVIDIA 驱动程序。
我的设备规格如下:
- 带有 Tesla M40 的服务器
- 在 Ubuntu 16.04 上运行
- 内核版本 Linux 4.4.0-116-generic x86_64
- 驱动程序: nvidia-384
有人能告诉我这是什么原因吗?
答案1
以下答案(我已经将其发布在另一个问题下)可能对您没有用,因为我对您的错误堆栈缺乏了解,但我会在这里发布以防万一它能有所帮助。
我在 3 月份安装了一些 Ubuntu 内核更新后遇到了类似的 nvidia-390 问题。我按照说明操作这里并成功解决了问题。一般来说,使用以下步骤:
- 如果无法登录桌面并陷入失败循环,请按
ctrl
+alt
+F1
登录命令行模式。 - 检查 gcc 的版本是否过时,如果是,请更新它:
gcc --version
- 如果gcc版本是5+,请先卸载nvidia驱动:
sudo apt-get remove nvidia-390
- 清除 4.4.0-116 内核: sudo apt-get purge linux-headers-4.4.0-116 linux-headers-4.4.0-116-generic linux-image-4.4.0-116-generic linux-image-extra-4.4.0-116-generic linux-signed-image-4.4.0-116-generic
- 重新安装内核:
sudo apt-get install linux-generic linux-signed-generic
- 重新安装 nvidia-390:
sudo apt-get install nvidia-390
- 检查问题是否已解决
modinfo nvidia-387 -k 4.4.0-116-generic | grep vermagic
,确保雷特波林这次出现 - 重启:
sudo reboot
希望这对您和其他遇到同样问题的人有用。论坛上的帖子拯救了我的周末。
答案2
按照这个答案也许更新至 NVIDIA 367.57 驱动程序可以解决您的问题。您可以在 Ubuntu 论坛上提问。