AMD GPU 随机冻结

AMD GPU 随机冻结

我有一台安装了 Ubuntu 18.04.2 的 ThinkPad A285。它配备了 Ryzen 7 2700U CPU。似乎 GPU 会随机冻结。无论它是否有负载都没关系。

我尝试将内核从 4.18.0 升级到 5.0.2,但问题仍然存在。

我还尝试安装 AMD 驱动程序这里,但似乎无法安装,进一步研究发现它只适用于 4.16 内核。我尝试降级,但随后陷入了登录循环。

/var/log/syslog就在事故发生前:

Mar 14 19:35:14 kernel: [ 1505.210444] amdgpu 0000:05:00.0: [gfxhub] VMC page fault (src_id:0 ring:24 vmid:4 pasid:32779)
Mar 14 19:35:14 kernel: [ 1505.210447] amdgpu 0000:05:00.0:   at page 0x000000010a208000 from 27
Mar 14 19:35:14 kernel: [ 1505.210451] amdgpu 0000:05:00.0: VM_L2_PROTECTION_FAULT_STATUS:0x00000000
Mar 14 19:35:14 kernel: [ 1505.210459] amdgpu 0000:05:00.0: [gfxhub] VMC page fault (src_id:0 ring:24 vmid:4 pasid:32779)
Mar 14 19:35:14 kernel: [ 1505.210462] amdgpu 0000:05:00.0:   at page 0x000000010a208000 from 27
Mar 14 19:35:14 kernel: [ 1505.210465] amdgpu 0000:05:00.0: VM_L2_PROTECTION_FAULT_STATUS:0x00000000
Mar 14 19:35:24 kernel: [ 1515.228395] [drm:amdgpu_job_timedout [amdgpu]] *ERROR* ring gfx timeout, last signaled seq=92425, last emitted seq=92427
Mar 14 19:35:24 kernel: [ 1515.228402] [drm] GPU recovery disabled.

答案1

我很久以前就遇到过同样的问题。这让我抓狂不已。尤其烦人,因为它会在偶尔的游戏会话(使用 Steam)期间随机冻结。amdgpu.gpu_recovery=1在启动字符串中添加内核参数 . 后,冻结现象大大减少。但是,只有在使用amdgpu驱动程序时才会出现这种情况。

  1. 编辑/etc/default/grub

  2. 修改变量的值GRUB_CMDLINE_LINUX_DEFAULT以包含amdgpu.gpu_recovery=1

  3. 跑步:

    sudo update-grub
    
  4. 重启。

我的 GRUB 配置行如下所示,因为我强制使用amdgpu驱动程序,即使我的 R9 280 据称不受支持(效果很好):

GRUB_CMDLINE_LINUX_DEFAULT="quiet splash amdgpu.si_support=1 radeon.si_support=0 amdgpu.cik_support=1 radeon.cik_support=0 amdgpu.gpu_recovery=1 elevator=noop"

如果你想知道这elevator=noop是什么,它应该有助于缓解 SSD 磨损。

希望这可以帮助。

答案2

我正在使用 amdgpu 19.10,它对我来说运行良好。

https://www.amd.com/en/support/kb/release-notes/rn-rad-lin-19-10-unified

我建议您使用 amdgpu(全开放驱动程序)而不是 amgdpu-pro 驱动程序。使用 pro-driver 会导致某些应用程序频繁崩溃(firefox 等...)

  • ThinkCenter M715q Tiny/Ryzen 5 Pro 2500U(BIOS M1XKT41A)
  • 内核 linux-image-4.18.0-21-generic
  • 驱动程序 amdgpu-core 19.10-785425
  • Wayland 上的 Ubuntu

之前我一直使用 ppa:oibaf/graphics-drivers。它似乎工作得很好。但从本月开始我无法启动 GUI 会话。我不确定这是由更新的内核、amdgpu 驱动程序还是其他原因造成的。

19.20新版本已经发布,稍后试试。 https://www.amd.com/en/support/kb/release-notes/rn-rad-lin-19-20-unified

相关内容