时间长短不一,从大约 1 分钟到 20 分钟,有时甚至永远不会。我的屏幕会变黑,并显示无信号,键盘和鼠标将停止工作。我的电脑仍然开着,磁盘灯仍然闪烁,我可以通过手机 SSH 连接。此外,任何媒体播放都会继续,直到结束,但如果我在 totem 中听音乐,它不会在结束后循环播放。
SSH 接入
一开始我以为是我的 GPU,所以我试了一下radeontop
。它报告了愚蠢的值,例如视频内存已使用 20,000%。无论我在“崩溃”之前还是之后运行它,一旦“崩溃”,它仍然会显示愚蠢的高百分比。
我可以看到我一直在运行的程序仍然打开,因为我可以获取它们的 PID。
sudo restart
不会重启我的电脑。sudo service gdm restart
似乎什么都没做。我的键盘没有 SysRQ 键,所以我无法 REISUB。
发生时间
- 当我点击 Firefox 上的链接时
- 如果我打开 VS Code
- 我忘记了
- 随机地,例如我的屏幕被锁定或发生其他情况
编辑:
me@my computer:~$ lspci -nn | grep VGA
08:00.0 VGA compatible controller [0300]: Advanced Micro Devices, Inc. [AMD/ATI] Ellesmere [Radeon RX 470/480/570/570X/580/580X/590] [1002:67df] (rev e7)
me@my computer:~$ glxinfo -B | grep -i '\(direct rendering\|opengl\|profile\)'
direct rendering: Yes
Preferred profile: core (0x1)
Max core profile version: 4.6
Max compat profile version: 4.6
Max GLES1 profile version: 1.1
Max GLES[23] profile version: 3.2
OpenGL vendor string: AMD
OpenGL renderer string: AMD Radeon RX 580 Series (POLARIS10, DRM 3.41.0, 5.13.0-52-generic, LLVM 12.0.0)
OpenGL core profile version string: 4.6 (Core Profile) Mesa 21.2.6
OpenGL core profile shading language version string: 4.60
OpenGL core profile context flags: (none)
OpenGL core profile profile mask: core profile
OpenGL version string: 4.6 (Compatibility Profile) Mesa 21.2.6
OpenGL shading language version string: 4.60
OpenGL context flags: (none)
OpenGL profile mask: compatibility profile
OpenGL ES profile version string: OpenGL ES 3.2 Mesa 21.2.6
OpenGL ES profile shading language version string: OpenGL ES GLSL ES 3.20
me@my computer:~$ sudo env X -version
[sudo] password for me:
X.Org X Server 1.20.13
X Protocol Version 11, Revision 0
Build Operating System: linux Ubuntu
Current Operating System: Linux my computer 5.13.0-52-generic #59~20.04.1-Ubuntu SMP Thu Jun 16 21:21:28 UTC 2022 x86_64
Kernel command line: BOOT_IMAGE=/boot/vmlinuz-5.13.0-52-generic root=UUID=facdf251-6fa6-469a-bdca-1647eabc527f ro quiet splash vt.handoff=7
Build Date: 14 December 2021 02:14:13PM
xorg-server 2:1.20.13-1ubuntu1~20.04.2 (For technical support please see http://www.ubuntu.com/support)
Current version of pixman: 0.38.4
Before reporting problems, check http://wiki.x.org
to make sure that you have the latest version.
me@my computer:~$ inxi -F
Command 'inxi' not found, but can be installed with:
sudo apt install inxi
me@my computer:~$ sudo apt install inxi
ok
me@my computer:~$ inxi -F
System:
Host: my computer Kernel: 5.13.0-52-generic x86_64 bits: 64 Desktop: Gnome 3.36.9
Distro: Ubuntu 20.04.4 LTS (Focal Fossa)
Machine:
Type: Desktop Mobo: ASUSTeK model: ROG STRIX B450-F GAMING v: Rev 1.xx
serial: <superuser/root required> UEFI: American Megatrends v: 3103
date: 06/17/2020
Battery:
ID-1: hidpp_battery_0 charge: N/A condition: N/A
CPU:
Topology: 6-Core model: AMD Ryzen 5 2600X bits: 64 type: MT MCP
L2 cache: 3072 KiB
Speed: 2055 MHz min/max: 2200/3600 MHz Core speeds (MHz): 1: 2044 2: 1972
3: 2187 4: 2190 5: 2191 6: 2192 7: 2184 8: 2166 9: 2122 10: 1884 11: 2196
12: 2191
Graphics:
Device-1: AMD Ellesmere [Radeon RX 470/480/570/570X/580/580X/590]
driver: amdgpu v: kernel
Display: x11 server: X.Org 1.20.13 driver: amdgpu
resolution: 1920x1080~60Hz
OpenGL: renderer: AMD Radeon RX 580 Series (POLARIS10 DRM 3.41.0
5.13.0-52-generic LLVM 12.0.0)
v: 4.6 Mesa 21.2.6
Audio:
Device-1: AMD Ellesmere HDMI Audio [Radeon RX 470/480 / 570/580/590]
driver: snd_hda_intel
Device-2: AMD Family 17h HD Audio driver: snd_hda_intel
Sound Server: ALSA v: k5.13.0-52-generic
Network:
Device-1: Intel I211 Gigabit Network driver: igb
IF: enp3s0 state: down mac: 24:4b:fe:e0:62:c0
Device-2: Ralink RT5572 Wireless Adapter type: USB driver: rt2800usb
IF: wlxe8de27a1d54e state: up mac: e8:de:27:a1:d5:4e
IF-ID-1: virbr0 state: down mac: 52:54:00:2f:c9:ac
IF-ID-2: virbr0-nic state: down mac: 52:54:00:2f:c9:ac
Drives:
Local Storage: total: 2.73 TiB used: 1.06 TiB (38.7%)
ID-1: /dev/sda vendor: Samsung model: SSD 860 EVO 1TB size: 931.51 GiB
ID-2: /dev/sdb vendor: Samsung model: SSD 870 EVO 2TB size: 1.82 TiB
Partition:
ID-1: / size: 915.40 GiB used: 510.45 GiB (55.8%) fs: ext4 dev: /dev/sda5
Sensors:
System Temperatures: cpu: 35.4 C mobo: N/A gpu: amdgpu temp: 50 C
Fan Speeds (RPM): N/A gpu: amdgpu fan: 3
Info:
Processes: 458 Uptime: 2h 43m Memory: 15.55 GiB used: 6.03 GiB (38.8%)
Shell: bash inxi: 3.0.38
me@my computer:~$ uname -r
5.13.0-52-generic
答案1
首先,你必须提供更多有关硬件和软件的信息,例如
LANG=C lspci -nn | grep VGA # might require installing pciutils
LANG=C glxinfo -B | grep -i '\(direct rendering\|opengl\|profile\)'
sudo env LANG=C X -version
inxi -F
uname -r
其次,可能是任何原因。例如,我曾经遇到过同样的症状,这是由于电容器损坏导致主板无法向 GPU 提供足够的电力而导致的硬件错误;因此它会随机冻结或在压力过大时冻结。
此外,如果是独立 GPU,请检查 GPU 是否已正确直接插入 PSU(如果有此类 PCIE 连接器)。有时,制造商会忘记插入,系统仍会启动(或已插入但松动)。
您还应该运行内存测试来排除 RAM 问题。
现在,假设这是一个 SW 问题,因为你可以通过 SSH 进入机器,一旦发生此问题,就会看到以下输出:
cat /var/log/Xorg.0.log
cat /var/log/syslog
cat /var/log/kern.log
通常错误信息会出现在那里。
sudo restart 不会重新启动我的电脑
尝试sudo shutdown -r now
一下
最后但同样重要的是,有时问题是由不稳定的电源变化引起的。尝试设置power_dpm_state或者功率-dpm-力-性能级别(取决于您的机器)始终以最大功率运行(也尝试始终以最小功率运行)
更新
您发布了您的系统规格。
您的 GPU(+ Mesa 驱动程序)在 Ubuntu 20.04 中非常稳定;所以我现在怀疑这是问题所在(除非是硬件)。
需要注意的事项:
- 您的 AMD GPU 散热量在空闲时过高(50°C)。在负载时检查散热量并检查风扇是否在旋转。它可能严重过热。
- 作为参考,当我使用 Chrome 在 askubuntu(室温:19°C)中打字时,我的温度是 32°C。
- 如前所述,请检查其他内核版本。这可能是暂时的回归(有时会发生这种情况)。还可以尝试 5.4.x 系列内核。
- 锐龙 5 2600已知为了固件错误与 Linux 上冻结的 C 状态有关。BIOS 更新通常可以修复它;否则尝试启动内核参数
idle=nomwait rcu_nocbs=0-11
,也许processor.max_cstate=5
。如果您的 BIOS 是最新的,那么您可能只需要添加acpi_osi=Linux
到启动参数中- 警告:不正确地更新 BIOS 可能会损坏您的主板,除非您有专门的工具来恢复它,或者主板具有 BIOS 恢复功能(某些型号有,特别是昂贵的型号)
- 警告 2:首先,您应该确定这不是硬件问题。例如,如果 RAM 坏了(首先运行内存测试),您真的在 RAM(或任何其他组件)发生故障时不要升级 BIOS,因为它可能会损坏或中断升级过程
- 在极少数情况下,如果您在 BIOS 升级后启用安全启动,BIOS 升级可能会导致您的 GPU 不再在该主板上工作;即使该 GPU 在升级前启用安全启动时可以正常工作(例子)。我的一个熟人在使用 AMD GPU 时也遇到过这个问题。
- 磁盘可能有问题。查找SATA 错误。还要检查和
sudo dmesg
的输出(或检查它们-> SMART 数据和自检)。sudo smartctl -a /dev/sda
sudo smartctl -a /dev/sdb
gnome-disks
- 两个磁盘都应该说
SMART overall-health self-assessment test result: PASSED
- 如果磁盘出现“故障”,则可能是 SATA 电缆存在问题(显然,请尽快备份所有内容)。
- 两个磁盘都应该说
- 前面的提示仍然适用(例如,可能是 PSU 出现故障:检查坏帽子,检查日志,运行内存测试以排除 RAM 问题)