Ubuntu 20.04 中无法使用 nVidia Gpu

Ubuntu 20.04 中无法使用 nVidia Gpu

我刚刚在配备 GeForce RTX 3070 ti 的笔记本电脑上安装了 Ubuntu 20.04。当我第一次启动 Ubuntu 时,我看到了一个黑屏。我不得不在启动时更改 Grub 条目,以便添加 nomodeset,然后通过附加驱动程序 GUI 下载驱动程序。
下载推荐的 nVidia 驱动程序 (510.73.05) 并重新启动后,我再次看到黑屏。这一次,即使在 Grub 条目中添加 nomodeset 也无法消除黑屏。为了解决这个问题,我必须启动到恢复模式并在 root shell 提示符下运行“prime-select intel”。重新启动后,我可以启动 Ubuntu,但使用的 GPU 不是 Nvidia
如果我尝试运行 nvidia-settings 并选择 nvidia Performance 或 nvidia On-Demand,重新启动时屏幕会再次变黑。如果我运行 prime-select Nvidia,也会发生同样的事情。我尝试多次手动清除并重新安装驱动程序,每次都使用不同的方法,但无济于事。目前 nomodeset 不在 grub 条目中,快速启动和安全启动被禁用,我使用的内核版本是 5.13.0-41-generic。

以下是一些命令的结果,显示了有关我的情况的信息:
nvidia 驱动程序:

$ dkms 状态
backport-iwlwifi,9858,5.13.0-41-generic,x86_64:已安装
nvidia,510.73.05,5.13.0-41-通用,x86_64:已安装

内核版本:

$ uname -r
5.13.0-41-通用

显示设备:

$ sudo lshw -c 显示
  *-显示未认领       
       描述:VGA兼容控制器
       产品:NVIDIA Corporation
       供应商:NVIDIA Corporation
       物理 ID:0
       总线信息:pci@0000:01:00.0
       版本:a1
       宽度:64 位
       时钟:33MHz
       功能:pm msi pciexpress vga_controller cap_list
       配置:延迟=0
       资源:iomemory:600-5ff iomemory:620-61f 内存:81000000-81ffffff 内存:6000000000-61ffffffff 内存:6200000000-6201ffffff ioport:4000(size=128) 内存:82000000-8207ffff
  *-显示未认领
       描述:VGA兼容控制器
       产品:英特尔公司
       供应商:英特尔公司
       物理 ID:2
       总线信息:pci@0000:00:02.0
       版本:0c
       宽度:64 位
       时钟:33MHz
       功能:pciexpress msi pm vga_controller bus_master cap_list
       配置:延迟=0
       资源:iomemory:620-61f iomemory:400-3ff 内存:6202000000-6202ffffff 内存:4000000000-400fffffff ioport:5000(size=64) 内存:c0000-dffff 内存:4010000000-4016ffffff 内存:4020000000-40ffffffff

看起来好像无法识别 nvidia 驱动程序...
nvidia 系统管理不可用:

$ nvidia-smi
NVIDIA-SMI 失败,因为它无法与 NVIDIA 驱动程序通信。请确保已安装并运行最新的 NVIDIA 驱动程序。

来自 nvidia 的错误报告日志的末尾有这样一行:

错误:nvmlInit():驱动程序未加载

我在 Xorg.o.log 中发现了这一点:

[ 16.819] (II) config/udev: 添加输入设备 HDA NVidia HDMI/DP,pcm=3 (/dev/input/event8)
[ 16.819] (II) 未指定输入驱动程序,忽略该设备。
[ 16.819] (II) 此设备可能已添加另一个设备文件。
[ 16.819] (II) config/udev: 添加输入设备 HDA NVidia HDMI/DP,pcm=7 (/dev/input/event9)
[ 16.819] (II) 未指定输入驱动程序,忽略该设备。
[ 16.819] (II) 此设备可能已添加另一个设备文件。
[ 16.819] (II) config/udev: 添加输入设备 HDA NVidia HDMI/DP,pcm=8 (/dev/input/event10)
[ 16.819] (II) 未指定输入驱动程序,忽略该设备。
[ 16.819] (II) 此设备可能已添加另一个设备文件。
[ 16.820] (II) config/udev: 添加输入设备 HDA NVidia HDMI/DP,pcm=9 (/dev/input/event11)
[ 16.820] (II) 未指定输入驱动程序,忽略该设备。
[ 16.820] (II) 此设备可能已添加另一个设备文件。
[ 16.820] (II) config/udev: 添加输入设备 HDA NVidia HDMI/DP,pcm=10 (/dev/input/event12)
[ 16.820] (II) 未指定输入驱动程序,忽略该设备。
[ 16.820] (II) 此设备可能已添加另一个设备文件。
[ 16.820] (II) config/udev: 添加输入设备 HDA NVidia HDMI/DP,pcm=11 (/dev/input/event13)
[ 16.820] (II) 未指定输入驱动程序,忽略该设备。
[ 16.820] (II) 此设备可能已添加另一个设备文件。

gpu-manager 的输出:

$ sudo gpu-manager
last_boot_file:/var/lib/ubuntu-drivers-common/last_gfx_boot
新启动文件:/var/lib/ubuntu-drivers-common/last_gfx_boot
无法访问 /run/udc-nvidia-was-loaded 文件
无法访问 /opt/amdgpu-pro/bin/amdgpu-pro-px
在 /lib/modules/5.13.0-41-generic/kernel 中查找 nvidia 模块
在 /lib/modules/5.13.0-41-generic/kernel/nvidia-510srv 中查找 nvidia 模块
在 /lib/modules/5.13.0-41-generic/kernel/nvidia-510 中查找 nvidia 模块
在 /lib/modules/5.13.0-41-generic/kernel/nvidia-470srv 中查找 nvidia 模块
在 /lib/modules/5.13.0-41-generic/kernel/nvidia-470 中查找 nvidia 模块
在 /lib/modules/5.13.0-41-generic/kernel/nvidia-450srv 中查找 nvidia 模块
在 /lib/modules/5.13.0-41-generic/kernel/nvidia-418srv 中查找 nvidia 模块
在 /lib/modules/5.13.0-41-generic/kernel/nvidia-390 中查找 nvidia 模块
在 /lib/modules/5.13.0-41-generic/updates/dkms 中查找 nvidia 模块
在 /lib/modules/5.13.0-41-generic/updates/dkms/nvidia.ko 中找到 nvidia.ko 模块
在 /lib/modules/5.13.0-41-generic/kernel 中查找 amdgpu 模块
在 /lib/modules/5.13.0-41-generic/updates/dkms 中查找 amdgpu 模块
nvidia 是否已加载?否
NVIDIA 是否被卸载?没有
nvidia 被列入黑名单了吗?是的
有情报吗?是的
radeon 是否已加载?否
radeon 是否被列入黑名单?没有
amdgpu 是否加载?没有
amdgpu 是否列入黑名单?没有
amdgpu 有版本吗?没有
amdgpu 是 pro 堆栈吗?没有
nouveau 是否已加载?否
nouveau 被列入黑名单了吗?是的
nvidia 内核模块可用吗?是的
amdgpu 内核模块可用吗?没有
供应商/设备 ID:8086:46a6
总线 ID “PCI:0@0:2:0”
启动 vga 吗?是的
错误:无法访问 /sys/bus/pci/devices/0000:00:02.0/driver
该设备未绑定到任何驱动程序。
供应商/设备 ID:10de:24a0
总线 ID “PCI:1@0:0:0”
启动是 vga 吗?没有
错误:无法访问 /sys/bus/pci/devices/0000:01:00.0/driver
该设备未绑定到任何驱动程序。
底盘类型:“10”
检测到笔记本电脑
无法访问 /etc/udc-nvidia-runtimepm-override 文件
无法打开 /sys/module/nvidia/version
警告:无法检查 NVIDIA 驱动程序主版本
未检测到对 Runtimepm 的支持。
您可以通过创建 /etc/udc-nvidia-runtimepm-override 文件来覆盖此检查,但风险由您自行承担。
nvidia 运行时 pm 是否支持“0x24a0”?是的
尝试创建新文件:/run/nvidia_runtimepm_supported
检查 /proc/driver/nvidia/gpus/0000:01:00.0/power 中的电源状态
打开 /proc/driver/nvidia/gpus/0000:01:00.0/power 时出错
nvidia 运行时 pm 是否针对“0x24a0”启用?否
错误:无法打开 /dev/dri
错误:无法打开 /dev/dri
错误:无法打开 /dev/dri
错误:无法打开 /dev/dri
是否需要卸载?否
最后一张牌的数字 = 2
有 amd 吗?没有
有情报吗?是的
有 Nvidia 吗?有
多少张卡?2
制度有改变吗? 没有
检测到 Intel IGP
NVIDIA 混合系统
在 /sys/bus/pci/devices/0000:01:00.0/power/control 中将电源控制设置为“自动”
尝试创建新文件:/lib/modprobe.d/nvidia-runtimepm.conf



有谁遇到过这个问题吗?有谁有解决方案吗?

谢谢!

相关内容