更新

更新

时间长短不一,从大约 1 分钟到 20 分钟,有时甚至永远不会。我的屏幕会变黑,并显示无信号,键盘和鼠标将停止工作。我的电脑仍然开着,磁盘灯仍然闪烁,我可以通过手机 SSH 连接。此外,任何媒体播放都会继续,直到结束,但如果我在 totem 中听音乐,它不会在结束后循环播放。

SSH 接入

一开始我以为是我的 GPU,所以我试了一下radeontop。它报告了愚蠢的值,例如视频内存已使用 20,000%。无论我在“崩溃”之前还是之后运行它,一旦“崩溃”,它仍然会显示愚蠢的高百分比。

我可以看到我一直在运行的程序仍然打开,因为我可以获取它们的 PID。

sudo restart不会重启我的电脑。sudo service gdm restart似乎什么都没做。我的键盘没有 SysRQ 键,所以我无法 REISUB。

发生时间

  • 当我点击 Firefox 上的链接时
  • 如果我打开 VS Code
  • 我忘记了
  • 随机地,例如我的屏幕被锁定或发生其他情况

编辑:

me@my computer:~$ lspci -nn | grep VGA
08:00.0 VGA compatible controller [0300]: Advanced Micro Devices, Inc. [AMD/ATI] Ellesmere [Radeon RX 470/480/570/570X/580/580X/590] [1002:67df] (rev e7)
me@my computer:~$ glxinfo -B | grep -i '\(direct rendering\|opengl\|profile\)' 
direct rendering: Yes
    Preferred profile: core (0x1)
    Max core profile version: 4.6
    Max compat profile version: 4.6
    Max GLES1 profile version: 1.1
    Max GLES[23] profile version: 3.2
OpenGL vendor string: AMD
OpenGL renderer string: AMD Radeon RX 580 Series (POLARIS10, DRM 3.41.0, 5.13.0-52-generic, LLVM 12.0.0)
OpenGL core profile version string: 4.6 (Core Profile) Mesa 21.2.6
OpenGL core profile shading language version string: 4.60
OpenGL core profile context flags: (none)
OpenGL core profile profile mask: core profile
OpenGL version string: 4.6 (Compatibility Profile) Mesa 21.2.6
OpenGL shading language version string: 4.60
OpenGL context flags: (none)
OpenGL profile mask: compatibility profile
OpenGL ES profile version string: OpenGL ES 3.2 Mesa 21.2.6
OpenGL ES profile shading language version string: OpenGL ES GLSL ES 3.20
me@my computer:~$ sudo env X -version
[sudo] password for me: 

X.Org X Server 1.20.13
X Protocol Version 11, Revision 0
Build Operating System: linux Ubuntu
Current Operating System: Linux my computer 5.13.0-52-generic #59~20.04.1-Ubuntu SMP Thu Jun 16 21:21:28 UTC 2022 x86_64
Kernel command line: BOOT_IMAGE=/boot/vmlinuz-5.13.0-52-generic root=UUID=facdf251-6fa6-469a-bdca-1647eabc527f ro quiet splash vt.handoff=7
Build Date: 14 December 2021  02:14:13PM
xorg-server 2:1.20.13-1ubuntu1~20.04.2 (For technical support please see http://www.ubuntu.com/support) 
Current version of pixman: 0.38.4
    Before reporting problems, check http://wiki.x.org
    to make sure that you have the latest version.
me@my computer:~$ inxi -F

Command 'inxi' not found, but can be installed with:

sudo apt install inxi

me@my computer:~$ sudo apt install inxi
ok
me@my computer:~$ inxi -F
System:
  Host: my computer Kernel: 5.13.0-52-generic x86_64 bits: 64 Desktop: Gnome 3.36.9 
  Distro: Ubuntu 20.04.4 LTS (Focal Fossa) 
Machine:
  Type: Desktop Mobo: ASUSTeK model: ROG STRIX B450-F GAMING v: Rev 1.xx 
  serial: <superuser/root required> UEFI: American Megatrends v: 3103 
  date: 06/17/2020 
Battery:
  ID-1: hidpp_battery_0 charge: N/A condition: N/A 
CPU:
  Topology: 6-Core model: AMD Ryzen 5 2600X bits: 64 type: MT MCP 
  L2 cache: 3072 KiB 
  Speed: 2055 MHz min/max: 2200/3600 MHz Core speeds (MHz): 1: 2044 2: 1972 
  3: 2187 4: 2190 5: 2191 6: 2192 7: 2184 8: 2166 9: 2122 10: 1884 11: 2196 
  12: 2191 
Graphics:
  Device-1: AMD Ellesmere [Radeon RX 470/480/570/570X/580/580X/590] 
  driver: amdgpu v: kernel 
  Display: x11 server: X.Org 1.20.13 driver: amdgpu 
  resolution: 1920x1080~60Hz 
  OpenGL: renderer: AMD Radeon RX 580 Series (POLARIS10 DRM 3.41.0 
  5.13.0-52-generic LLVM 12.0.0) 
  v: 4.6 Mesa 21.2.6 
Audio:
  Device-1: AMD Ellesmere HDMI Audio [Radeon RX 470/480 / 570/580/590] 
  driver: snd_hda_intel 
  Device-2: AMD Family 17h HD Audio driver: snd_hda_intel 
  Sound Server: ALSA v: k5.13.0-52-generic 
Network:
  Device-1: Intel I211 Gigabit Network driver: igb 
  IF: enp3s0 state: down mac: 24:4b:fe:e0:62:c0 
  Device-2: Ralink RT5572 Wireless Adapter type: USB driver: rt2800usb 
  IF: wlxe8de27a1d54e state: up mac: e8:de:27:a1:d5:4e 
  IF-ID-1: virbr0 state: down mac: 52:54:00:2f:c9:ac 
  IF-ID-2: virbr0-nic state: down mac: 52:54:00:2f:c9:ac 
Drives:
  Local Storage: total: 2.73 TiB used: 1.06 TiB (38.7%) 
  ID-1: /dev/sda vendor: Samsung model: SSD 860 EVO 1TB size: 931.51 GiB 
  ID-2: /dev/sdb vendor: Samsung model: SSD 870 EVO 2TB size: 1.82 TiB 
Partition:
  ID-1: / size: 915.40 GiB used: 510.45 GiB (55.8%) fs: ext4 dev: /dev/sda5 
Sensors:
  System Temperatures: cpu: 35.4 C mobo: N/A gpu: amdgpu temp: 50 C 
  Fan Speeds (RPM): N/A gpu: amdgpu fan: 3 
Info:
  Processes: 458 Uptime: 2h 43m Memory: 15.55 GiB used: 6.03 GiB (38.8%) 
  Shell: bash inxi: 3.0.38
me@my computer:~$ uname -r
5.13.0-52-generic

答案1

首先,你必须提供更多有关硬件和软件的信息,例如

LANG=C lspci -nn | grep VGA  # might require installing pciutils
LANG=C glxinfo -B | grep -i '\(direct rendering\|opengl\|profile\)' 
sudo env LANG=C X -version
inxi -F
uname -r

其次,可能是任何原因。例如,我曾经遇到过同样的症状,这是由于电容器损坏导致主板无法向 GPU 提供足够的电力而导致的硬件错误;因此它会随机冻结或在压力过大时冻结。

此外,如果是独立 GPU,请检查 GPU 是否已正确直接插入 PSU(如果有此类 PCIE 连接器)。有时,制造商会忘记插入,系统仍会启动(或已插入但松动)。

您还应该运行内存测试来排除 RAM 问题。

现在,假设这是一个 SW 问题,因为你可以通过 SSH 进入机器,一旦发生此问题,就会看到以下输出:

cat /var/log/Xorg.0.log
cat /var/log/syslog
cat /var/log/kern.log

通常错误信息会出现在那里。

sudo restart 不会重新启动我的电脑

尝试sudo shutdown -r now一下

最后但同样重要的是,有时问题是由不稳定的电源变化引起的。尝试设置power_dpm_state或者功率-dpm-力-性能级别(取决于您的机器)始终以最大功率运行(也尝试始终以最小功率运行)

更新

您发布了您的系统规格。

您的 GPU(+ Mesa 驱动程序)在 Ubuntu 20.04 中非常稳定;所以我现在怀疑这是问题所在(除非是硬件)。

需要注意的事项:

  • 您的 AMD GPU 散热量在空闲时过高(50°C)。在负载时检查散热量并检查风扇是否在旋转。它可能严重过热。
    • 作为参考,当我使用 Chrome 在 askubuntu(室温:19°C)中打字时,我的温度是 32°C。
  • 如前所述,请检查其他内核版本。这可能是暂时的回归(有时会发生这种情况)。还可以尝试 5.4.x 系列内核。
  • 锐龙 5 2600已知为了固件错误与 Linux 上冻结的 C 状态有关。BIOS 更新通常可以修复它;否则尝试启动内核参数idle=nomwait rcu_nocbs=0-11,也许processor.max_cstate=5。如果您的 BIOS 是最新的,那么您可能只需要添加acpi_osi=Linux到启动参数中
    • 警告:不正确地更新 BIOS 可能会损坏您的主板,除非您有专门的工具来恢复它,或者主板具有 BIOS 恢复功能(某些型号有,特别是昂贵的型号)
    • 警告 2:首先,您应该确定这不是硬件问题。例如,如果 RAM 坏了(首先运行内存测试),您真的在 RAM(或任何其他组件)发生故障时不要升级 BIOS,因为它可能会损坏或中断升级过程
    • 在极少数情况下,如果您在 BIOS 升级后启用安全启动,BIOS 升级可能会导致您的 GPU 不再在该主板上工作;即使该 GPU 在升级前启用安全启动时可以正常工作(例子)。我的一个熟人在使用 AMD GPU 时也遇到过这个问题。
  • 磁盘可能有问题。查找SATA 错误。还要检查和sudo dmesg的输出(或检查它们-> SMART 数据和自检)。 sudo smartctl -a /dev/sdasudo smartctl -a /dev/sdbgnome-disks
    • 两个磁盘都应该说SMART overall-health self-assessment test result: PASSED
    • 如果磁盘出现“故障”,则可能是 SATA 电缆存在问题(显然,请尽快备份所有内容)。
  • 前面的提示仍然适用(例如,可能是 PSU 出现故障:检查坏帽子,检查日志,运行内存测试以排除 RAM 问题)

相关内容