使用 Ubuntu 18.04 和 Amd Pro WX 3100 暂停机器第二次不起作用

使用 Ubuntu 18.04 和 Amd Pro WX 3100 暂停机器第二次不起作用

我对 Ubuntu 这个美丽的词语还很陌生,真的。这是我的第一个问题,所以很抱歉,我无法提供正确的详细信息,因为我不知道正确的命令。

问题:

启动PC过程:没有问题

第一次暂停:没有问题

第二次暂停:我无法再将电脑置于睡眠模式,屏幕一开始是黑色的,似乎什么都不起作用,然后过了 20 秒左右,电脑开始工作,但从此时到下一次关机,睡眠模式不再起作用。有时我还会遇到一些鼠标冻结问题。

我尝试了不同的内核版本,但没有任何变化。我认为问题与双 GPU 卡系统有关。提前感谢大家,抱歉没有提供详细信息。

笔记本电脑:HP Zbook 15u G5,双 GPU(英特尔和 AMD Pro WX3100)。

命令结果lspci -nn | grep -E 'VGA|Display'

00:02.0 VGA compatible controller [0300]: Intel Corporation UHD Graphics 620 [8086:5917] (rev 07) 01:00.0 Display controller [0380]: Advanced Micro Devices, Inc. [AMD/ATI] Lexa XT [Radeon PRO WX 3100] [1002:6985]

Ubuntu:18.04

内核:4.18.10-041810-通用

答案1

我也是!和你一样的机器(HP Zbook G5)。lspci 的输出:

00:02.0 VGA compatible controller [0300]: Intel Corporation UHD Graphics 620 [8086:5917] (rev 07)
01:00.0 Display controller [0380]: Advanced Micro Devices, Inc. [AMD/ATI] Polaris12 [1002:6985]

内核:4.15.0-36-generic。我正在运行基于 Ubuntu 18.04 LTS Bionic 的 Mint 19。

我还注意到,在第一次挂起后,lspci 将被阻止(并且无法终止)。

恢复时在 amdgpu 周围的系统日志中有一些痕迹:

Oct 13 10:57:36 TIX-02 kernel: [  114.169456] [drm] PCIE GART of 256M enabled (table at 0x000000F400040000).
Oct 13 10:57:36 TIX-02 kernel: [  114.211766] e1000e: enp0s31f6 NIC Link is Down
Oct 13 10:57:36 TIX-02 kernel: [  114.214529] IPv6: ADDRCONF(NETDEV_UP): enp0s31f6: link is not ready
Oct 13 10:57:36 TIX-02 kernel: [  114.225226] BUG: unable to handle kernel paging request at ffffb57f01b08fec
Oct 13 10:57:36 TIX-02 kernel: [  114.225269] IP: smu7_populate_single_firmware_entry.isra.6+0x5b/0xe0 [amdgpu]
Oct 13 10:57:36 TIX-02 kernel: [  114.225271] PGD 45ed48067 P4D 45ed48067 PUD 0 
Oct 13 10:57:36 TIX-02 kernel: [  114.225275] Oops: 0002 [#1] SMP PTI
Oct 13 10:57:36 TIX-02 kernel: [  114.225276] Modules linked in: rfcomm pci_stub vboxpci(O) vboxnetadp(O) vboxnetflt(O) vboxdrv(O) bnep binfmt_misc nls_iso8859_1 arc4 snd_hda_codec_hdmi snd_hda_codec_conexant snd_hda_codec_generic snd_soc_skl snd_soc_skl_ipc snd_hda_ext_core snd_soc_sst_dsp snd_soc_sst_ipc snd_soc_acpi snd_soc_core snd_compress ac97_bus snd_pcm_dmaengine hid_multitouch intel_rapl x86_pkg_temp_thermal intel_powerclamp coretemp kvm_intel kvm irqbypass snd_hda_intel crct10dif_pclmul snd_hda_codec snd_hda_core crc32_pclmul snd_hwdep ghash_clmulni_intel pcbc snd_pcm snd_seq_midi snd_seq_midi_event iwlmvm mac80211 snd_rawmidi aesni_intel btusb btrtl aes_x86_64 btbcm crypto_simd glue_helper btintel cryptd intel_cstate bluetooth idma64 virt_dma snd_seq snd_seq_device snd_timer ecdh_generic intel_rapl_perf iwlwifi uvcvideo
Oct 13 10:57:36 TIX-02 kernel: [  114.225346] CPU: 2 PID: 61 Comm: kworker/2:1 Tainted: G           O     4.15.0-36-generic #39-Ubuntu
Oct 13 10:57:36 TIX-02 kernel: [  114.225347] Hardware name: HP HP ZBook 15u G5/83B2, BIOS Q78 Ver. 01.03.00 07/18/2018
Oct 13 10:57:36 TIX-02 kernel: [  114.225351] Workqueue: pm pm_runtime_work
Oct 13 10:57:36 TIX-02 kernel: [  114.225383] RIP: 0010:smu7_populate_single_firmware_entry.isra.6+0x5b/0xe0 [amdgpu]
Oct 13 10:57:36 TIX-02 kernel: [  114.225384] RSP: 0018:ffffb56301b6fb98 EFLAGS: 00010246
Oct 13 10:57:36 TIX-02 kernel: [  114.225386] RAX: 0000000000000089 RBX: ffffb57f01b08fec RCX: 0000000000534000
Oct 13 10:57:36 TIX-02 kernel: [  114.225387] RDX: ffffffffc08be38d RSI: 0000000000000000 RDI: ffff9ece9c4a4cc0
Oct 13 10:57:36 TIX-02 kernel: [  114.225389] RBP: ffffb56301b6fbe8 R08: 000000000003fa80 R09: ffffb56301b6fbcc
Oct 13 10:57:36 TIX-02 kernel: [  114.225390] R10: 0000000000000000 R11: 0000000000000000 R12: 0000000000000003
Oct 13 10:57:36 TIX-02 kernel: [  114.225391] R13: ffff9ece9ed44010 R14: ffff9ece8fd02000 R15: 000000000000047e
Oct 13 10:57:36 TIX-02 kernel: [  114.225393] FS:  0000000000000000(0000) GS:ffff9eceaf480000(0000) knlGS:0000000000000000
Oct 13 10:57:36 TIX-02 kernel: [  114.225394] CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Oct 13 10:57:36 TIX-02 kernel: [  114.225396] CR2: ffffb57f01b08fec CR3: 0000000166e0a005 CR4: 00000000003606e0
Oct 13 10:57:36 TIX-02 kernel: [  114.225397] Call Trace:
Oct 13 10:57:36 TIX-02 kernel: [  114.225427]  smu7_request_smu_load_fw+0xb7/0x340 [amdgpu]
Oct 13 10:57:36 TIX-02 kernel: [  114.225454]  polaris10_start_smu+0xdd/0x220 [amdgpu]
Oct 13 10:57:36 TIX-02 kernel: [  114.225484]  pp_resume+0x49/0xb0 [amdgpu]
Oct 13 10:57:36 TIX-02 kernel: [  114.225510]  amdgpu_pp_resume+0x25/0x30 [amdgpu]
Oct 13 10:57:36 TIX-02 kernel: [  114.225529]  amdgpu_resume_phase2+0x4b/0xc0 [amdgpu]
Oct 13 10:57:36 TIX-02 kernel: [  114.225549]  amdgpu_device_resume+0x15f/0x3d0 [amdgpu]
Oct 13 10:57:36 TIX-02 kernel: [  114.225551]  ? __pci_set_master+0x34/0xe0
Oct 13 10:57:36 TIX-02 kernel: [  114.225555]  ? vga_switcheroo_set_dynamic_switch+0x80/0x80
Oct 13 10:57:36 TIX-02 kernel: [  114.225573]  amdgpu_pmops_runtime_resume+0x76/0xc0 [amdgpu]
Oct 13 10:57:36 TIX-02 kernel: [  114.225576]  pci_pm_runtime_resume+0x7b/0xb0
Oct 13 10:57:36 TIX-02 kernel: [  114.225579]  vga_switcheroo_runtime_resume+0x53/0x60
Oct 13 10:57:36 TIX-02 kernel: [  114.225580]  __rpm_callback+0xca/0x210
Oct 13 10:57:36 TIX-02 kernel: [  114.225583]  ? vga_switcheroo_set_dynamic_switch+0x80/0x80
Oct 13 10:57:36 TIX-02 kernel: [  114.225585]  rpm_callback+0x24/0x80
Oct 13 10:57:36 TIX-02 kernel: [  114.225587]  ? vga_switcheroo_set_dynamic_switch+0x80/0x80
Oct 13 10:57:36 TIX-02 kernel: [  114.225589]  rpm_resume+0x4e1/0x7d0
Oct 13 10:57:36 TIX-02 kernel: [  114.225591]  pm_runtime_work+0x55/0xa0
Oct 13 10:57:36 TIX-02 kernel: [  114.225593]  process_one_work+0x1de/0x410
Oct 13 10:57:36 TIX-02 kernel: [  114.225595]  worker_thread+0x32/0x410
Oct 13 10:57:36 TIX-02 kernel: [  114.225598]  kthread+0x121/0x140
Oct 13 10:57:36 TIX-02 kernel: [  114.225600]  ? process_one_work+0x410/0x410
Oct 13 10:57:36 TIX-02 kernel: [  114.225602]  ? kthread_create_worker_on_cpu+0x70/0x70
Oct 13 10:57:36 TIX-02 kernel: [  114.225605]  ret_from_fork+0x35/0x40
Oct 13 10:57:36 TIX-02 kernel: [  114.225607] Code: 00 48 89 45 e0 31 c0 f3 48 ab 49 8b 7d 00 89 f0 0f b6 b0 a0 55 9b c0 48 8b 07 48 8b 40 70 e8 2d dd 72 ca 85 c0 75 48 0f b7 45 b2 <66> 44 89 23 48 c7 43 0c 00 00 00 00 66 89 43 02 48 8b 45 c0 48 
Oct 13 10:57:36 TIX-02 kernel: [  114.225659] RIP: smu7_populate_single_firmware_entry.isra.6+0x5b/0xe0 [amdgpu] RSP: ffffb56301b6fb98
Oct 13 10:57:36 TIX-02 kernel: [  114.225661] CR2: ffffb57f01b08fec
Oct 13 10:57:36 TIX-02 kernel: [  114.225662] ---[ end trace 13979f48dea591d0 ]---

由于待处理的工作队列,后续暂停失败:

Oct 13 11:00:26 TIX-02 kernel: [  283.318936] Freezing of tasks failed after 20.010 seconds (0 tasks refusing to freeze, wq_busy=1):
Oct 13 11:00:26 TIX-02 kernel: [  283.318944] Showing busy workqueues and worker pools:
Oct 13 11:00:26 TIX-02 kernel: [  283.318958] workqueue pm: flags=0x4
Oct 13 11:00:26 TIX-02 kernel: [  283.318967]   pwq 6: cpus=3 node=0 flags=0x0 nice=0 active=0/0
Oct 13 11:00:26 TIX-02 kernel: [  283.318990]     delayed: pm_runtime_work
Oct 13 11:00:26 TIX-02 kernel: [  283.319061]   pwq 4: cpus=2 node=0 flags=0x0 nice=0 active=2/0
Oct 13 11:00:26 TIX-02 kernel: [  283.319081]     in-flight: 2481:pm_runtime_work pm_runtime_work
Oct 13 11:00:26 TIX-02 kernel: [  283.319109] workqueue writeback: flags=0x4e
Oct 13 11:00:26 TIX-02 kernel: [  283.319115]   pwq 16: cpus=0-7 flags=0x4 nice=0 active=0/0
Oct 13 11:00:26 TIX-02 kernel: [  283.319133]     delayed: wb_workfn
Oct 13 11:00:26 TIX-02 kernel: [  283.319177] pool 4: cpus=2 node=0 flags=0x0 nice=0 hung=12s workers=5 idle: 676 2036 23 481
Oct 13 11:00:26 TIX-02 kernel: [  283.319334] Restarting kernel threads ... done.
Oct 13 11:00:26 TIX-02 kernel: [  283.319837] OOM killer enabled.

因此从全局来看,ampgpu 和 resume 不能很好地协同工作...这里也提到了:https://www.linuxquestions.org/questions/linux-laptop-and-netbook-25/suspend-resume-dosen%27t-work-on-hybrid-graphic-laptop-4175627735/但解决方案是一种变通方法(休眠而不是挂起)。

我已经从 /lib/firmware/amdgpu 中删除了 Polaris10 和 Polaris11 的固件:行为相同。

我的 amdgpu 驱动程序是 X.org 版本 18.0.1-1;这意味着我没有使用最新版本,18.1.0

我首先尝试安装最新的 AMD 驱动程序,欺骗安装脚本(os-release mint/ubuntu 问题)。但是,当重新启动时,Cinnamon 进入回退模式,并且挂起行为相同:所以我卸载了 AMD 驱动程序...

然后,我尝试了描述的解决方案这里。但这更糟糕:当恢复系统时,显示屏冻结,没有鼠标或键盘响应,甚至 Magis Sysrq 也无济于事。

然后...得到了最新的 ubuntu 18.1.0-1 xserver-xorg-video-amdgpu包源,编译并安装它:没有变化!

得到最新的 Ubuntu linux 固件包,安装它:没有变化。

git clone git://git.kernel.org/pub/scm/linux/kernel/git/firmware/linux-firmware.git 并将 Polaris12 固件放入 /lib/firmware ...问题仍然存在。

这似乎与内核本身、或者 amdgpu 内核驱动程序或 DRM 有关。

我已经通过 UKUU 安装了一些内核:

  1. 4.18.14 运行良好!试试吧!(对我来说不行,我有 virtualbox 5.2.10,vboxdrv 模块无法在 4.18.14 上编译)
  2. 4.14.76 也一样!(对我来说,virtualbox 5.2.10 也行)
  3. 4.4.161 无法启动

相关内容