我突然遇到了一个奇怪的问题。我昨天安装了最新的 Nvidia 专有驱动程序,成功关闭了 PC。今天早上启动时,我发现我的两个显示器中有一个不工作,并在重启时注意到这些错误消息
[ 7.348261] kernel: [drm:nv_drm_load [nvidia_drm]] ERROR [nvidia-drm] [GPU ID 0x00000800] Failed to allocate NvKmsKapiDevice
[ 7.348371] kernel: [drm:nv_drm_probe_devices [nvidia_drm]] ERROR [nvidia-drm] [GPU ID 0x00000800] Failed to register device
考虑到某些驱动程序崩溃,我使用 TTY 卸载了专有驱动程序并安装了默认驱动程序,但启动时仍然看到相同的 DRM 错误。我无法安装正确的驱动程序(所有 Nvidia 驱动程序在 Ubuntu 软件“附加驱动程序”中都显示为灰色),因此无法使用我的双显示器设置。我有一个 Windows 双启动设置,它在 Windows 上运行良好。我已在 BIOS 中禁用虚拟化,没有效果。
系统也不稳定。有时登录后,屏幕会变黑,但电脑在后台运行,因为我按了正确的键盘快捷键,所以我能够关闭电脑。有时它不会变黑,而且运行正常(过去 12 小时它一直与一台显示器一起工作)
uname -r
输出5.15.0-52-generic
任何帮助将不胜感激。
谢谢
更新:我继续使用 TTY 安装了nvidia-driver-515-server
驱动程序。不过从那以后我就没重启过电脑。如何解决此问题
答案1
尝试回滚您的驱动程序。我在驱动程序版本 515 和 520 上使用 RTX2070 时也遇到了同样的错误消息。
我安装了驱动程序 510,它对我来说工作正常。
答案2
我也有 rtx 3060ti。必须安装旧版驱动程序:
sudo apt remove nvidia* && \
sudo apt autoremove && \
sudo apt install --reinstall nvidia-driver-470
记得重启然后尝试nvidia-smi
。如果仍然找不到 gpu 设备,请查看内核日志以寻找线索
cat /var/log/kern.log
相关链接
https://forums.developer.nvidia.com/t/failed-to-allocate-nvkmskapidevice-in-hiveos/213998