解决 20.04 系统挂起问题帮助

解决 20.04 系统挂起问题帮助

因此,运行 ubuntu 20.04.1,截至今天为最新版本,32 GB 内存,系统负载通常 < 1,i9-9900k 未超频。上个月它挂起了两次。挂起的意思是控制台没有响应、没有网络、什么都不工作、显示时间停止、键盘不工作等。什么都不起作用,就像崩溃一样。但我找不到崩溃的证据,我应该去哪里找?发生这种情况的两次都是在机器空闲时(没有人打字或使用它,当然进程在运行)。我安装了 monitorix,因此可以看到系统状况、温度等,直到 16:07 的挂起时间。没什么不寻常的。崩溃时每个核心的温度约为 88F(不是 C)。系统负载略低于 1。使用 + 共享内存是 32G 中的 15G。 MB 报告的 ACPI 温度为 81F,pch 为 123F,nvidia RTX2060 温度为 99F。2 个内置硬盘温度为 100F。主板是 Gigabyte Z390 Aorus Pro WiFi。简而言之,状态很好。

来自系统日志:

Nov 25 16:05:46 Home-Server systemd[1]: Started ZSYS daemon service.
Nov 25 16:05:46 Home-Server zsysd[2442258]: sfatula
Nov 25 16:05:46 Home-Server zsysctl[2442251]: level=error msg="couldn't save state for user \"sfatula\": Current machine isn't Zsys, nothing to create"
Nov 25 16:05:46 Home-Server systemd[6470]: zsys-user-savestate.service: Main process exited, code=exited, status=1/FAILURE
Nov 25 16:05:46 Home-Server systemd[6470]: zsys-user-savestate.service: Failed with result 'exit-code'.
Nov 25 16:05:46 Home-Server systemd[6470]: Failed to start Save current user state periodically.
^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@Nov 25 16:39:01 Home-Server systemd-modules-load[608]: Inserted module 'lp'
Nov 25 16:39:01 Home-Server kernel: [    0.000000] microcode: microcode updated early to revision 0xde, date = 2020-05-24

因此,当我尝试了控制台、ssh 等各种键盘命令并重新启动后,桌面时钟显示的时间是冻结的 16:07。

kern.log 中没有什么异常:

Nov 25 14:55:19 Home-Server canonical-livepatch[5022]: No payload available.
Nov 25 15:44:44 Home-Server canonical-livepatch[5022]: Client.Check
Nov 25 15:44:44 Home-Server canonical-livepatch[5022]: Checking with livepatch service.
Nov 25 15:44:45 Home-Server canonical-livepatch[5022]: Updated last-check.
Nov 25 15:44:45 Home-Server canonical-livepatch[5022]: No updates available at this time.
Nov 25 15:44:45 Home-Server canonical-livepatch[5022]: No payload available.
Nov 25 16:39:01 Home-Server kernel: [    0.000000] microcode: microcode updated early to revision 0xde, date = 2020-05-24
Nov 25 16:39:01 Home-Server kernel: [    0.000000] Linux version 5.4.0-54-generic (buildd@lcy01-amd64-024) (gcc version 9.3.0 (Ubuntu 9.3.0-17ubuntu1~20.04)) #60-Ubuntu SMP Fri Nov 6 10:37:59 UTC 2020 (Ubuntu 5.4.0-54.60-generic 5.4.65)


grep -i swap /etc/fstab
/swapfile                                 none            swap    sw              0       0

dmidecode -s bios-version
F12c

free -h
              total        used        free      shared  buff/cache   available
Mem:           31Gi        12Gi        13Gi       1.2Gi       5.4Gi        17Gi
Swap:         2.0Gi          0B       2.0Gi

翻看其他日志,我没有看到任何有用的信息。/var/crash 中没有任何内容。错误数据库中没有任何内容让我印象深刻。所以,不知道下一步该去哪里或查看哪里。

18.04 从来没有对我这样做过。我没有进行升级,也没有像往常一样在大约 2 个月前或任何可用时进行全新安装。在进行全新安装之前,我进行了一次完整的夜间内存测试,因为我在进行全新安装时会这样做。什么也没发现。此外,smartctl 中没有任何指示。

有什么想法、建议、可去的地方或可尝试的事情吗?

答案1

BIOS

技嘉 Z390 Aorus Pro WiFi

您的 BIOS 版本为 F12c。

有较新的 BIOS 可用,版本 F12j,日期为 2020 年 9 月 16 日,可以下载这里

注意:确认我拥有您主板的正确网页。

注意:更新 BIOS 之前请做好备份。

记忆

https://www.memtest86.com/并免费下载/运行它们memtest来测试你的记忆力。至少完成一次所有 4/4 测试以确认记忆力良好。这可能需要几个小时才能完成。

相关内容