我最近开始在笔记本电脑上使用 Ubuntu。这台笔记本电脑是 HP Zbook 15vG5,配备 Quadro P600 GPU、Intel I7 8750h 和 32GB RAM。当我通过 Thunderbolt 使用我的旧 GTX1060 时,一切都运行良好,没有任何问题。系统运行稳定,性能也符合您的预期。
但是,如果我尝试使用没有外部 GPU 的笔记本电脑,大约每 1-3 小时就会崩溃一次。屏幕冻结,但音频继续播放一段时间,直到它也停止。我现在已经尝试了 3 种不同的驱动程序,NVIDIA-455、NVIDIA-450 和 NVIDIA-390。Noveau 不是一个选项,因为我需要 CUDA 支持某些应用程序。所有驱动程序都存在此问题。此外,该问题与通过 HDMI、显示端口或内置端口使用外部显示器无关。
此外,使用“按需”PRIME 配置文件会导致 UI 响应非常慢。每个操作都需要一秒钟以上才能完成。我发现这作为一种可能的解决方案,但是以 root 权限运行包装器对我来说似乎不是一个好主意。它解决了缓慢问题,但没有解决崩溃问题,所以我再次禁用了它。
最近一次冻结后,我在系统日志中发现了以下内容:
Oct 6 12:18:11 unkown kernel: [61883.999272] NVRM: GPU at PCI:0000:01:00: GPU-2024c25d-275a-4807-15d8-f2ec16f19df3
Oct 6 12:18:11 unkown kernel: [61883.999273] NVRM: Xid (PCI:0000:01:00): 79, pid=2318, GPU has fallen off the bus.
Oct 6 12:18:11 unkown kernel: [61883.999275] NVRM: GPU 0000:01:00.0: GPU has fallen off the bus.
Oct 6 12:18:11 unkown kernel: [61883.999289] NVRM: A GPU crash dump has been created. If possible, please run
Oct 6 12:18:11 unkown kernel: [61883.999289] NVRM: nvidia-bug-report.sh as root to collect this data before
Oct 6 12:18:11 unkown kernel: [61883.999289] NVRM: the NVIDIA kernel module is unloaded.
但是我不知道如何运行 nvidia-bug-report.sh。我没有可以用来远程访问此程序的设备,而且我是 Linux 新手,所以我有点迷茫。此外,我能找到的关于该行为的所有信息是唤醒过程中存在问题,但对我来说情况并非如此。它发生在使用笔记本电脑时。
如果您需要任何信息,请随时询问,我会尽力提供。
编辑:我忘了提一下,一旦开始冻结,CPU 风扇也会加速到最大。
修改 2:为了测试 GPU 是否损坏(我没想到会这样,因为几天前它在 Windows 上运行良好),我在 GPU 上运行了游戏和压力测试。在我让它运行的 30 分钟内,它根本没有问题。我会让压力测试运行一段时间,如果它在此期间也崩溃了,我会更新。