最近,我更换了我的旧桌面(MB、CPU、RAM、机箱;我保留了旧磁盘)并升级到 Fedora 29(这是全新安装),现在我的机器偶尔崩溃(有时相隔几天) ,但更常见的是相隔几周)。
崩溃导致机器完全冻结、无响应,DE(xfce,如果这很重要的话)保持不变(没有任何东西,甚至鼠标指针都没有移动或响应)。 SSH 访问也停止工作,因此机器完全死机了;不仅仅是DE。
我的第一反应是检查一下/var/log/messages
,这就是我感到惊讶的地方:
Sep 21 04:03:23 machinename.localdomain audit[693]: USER_LOGIN pid=693 uid=0 auid=4294967295 ses=4294967295 msg='op
=login acct="(unknown)" exe="/usr/sbin/sshd" hostname=? addr=153.36.242.143 terminal=ssh res=failed'
Sep 21 04:05:09 machinename.localdomain NetworkManager[946]: <info> [1569035109.9317] policy: set 'enp0s31f6' (enp
0s31f6) as default for IPv6 routing and DNS
^@^@^@^@... (very long, without newline at the end)Sep 24 09:42:35 machinename syslog-ng[829]: syslog-ng starting up; version='3.17.2'
因此,通常的消息是“有人试图获取你的 ssh”并喜欢,没什么奇怪的,然后突然出现一个非常奇怪的字符串^@
(我认为这是一个特殊的字符,而不是两个字符)。我记得它与之前的崩溃中的角色完全相同。
硬件非常标准:
# lspci
00:00.0 Host bridge: Intel Corporation Xeon E3-1200 v6/7th Gen Core Processor Host Bridge/DRAM Registers (rev 05)
00:02.0 VGA compatible controller: Intel Corporation HD Graphics 630 (rev 04)
00:14.0 USB controller: Intel Corporation 200 Series/Z370 Chipset Family USB 3.0 xHCI Controller
00:16.0 Communication controller: Intel Corporation 200 Series PCH CSME HECI #1
00:17.0 SATA controller: Intel Corporation 200 Series PCH SATA controller [AHCI mode]
00:1b.0 PCI bridge: Intel Corporation 200 Series PCH PCI Express Root Port #17 (rev f0)
00:1c.0 PCI bridge: Intel Corporation 200 Series PCH PCI Express Root Port #1 (rev f0)
00:1c.4 PCI bridge: Intel Corporation 200 Series PCH PCI Express Root Port #5 (rev f0)
00:1d.0 PCI bridge: Intel Corporation 200 Series PCH PCI Express Root Port #9 (rev f0)
00:1f.0 ISA bridge: Intel Corporation 200 Series PCH LPC Controller (Z270)
00:1f.2 Memory controller: Intel Corporation 200 Series/Z370 Chipset Family Power Management Controller
00:1f.3 Audio device: Intel Corporation 200 Series PCH HD Audio
00:1f.4 SMBus: Intel Corporation 200 Series/Z370 Chipset Family SMBus Controller
00:1f.6 Ethernet controller: Intel Corporation Ethernet Connection (2) I219-V
03:00.0 USB controller: ASMedia Technology Inc. ASM2142 USB 3.1 Host Controller
# uname -a
Linux machinename.localdomain 5.1.18-200.fc29.x86_64 #1 SMP Mon Jul 15 16:09:08 UTC 2019 x86_64 x86_64 x86_64 GNU/Linux
如果我使用外部 3.5 英寸硬盘(与我在旧系统中使用的相同磁盘和盒,非常稳定),它似乎更有可能崩溃,但不会立即崩溃。通常,它会在几个小时甚至一两天后崩溃我不确定是否卸载并拔出了磁盘,但在这种情况下也可能不会总是发生崩溃。
此外,它不必与外部 USB 存储相关。首先,它似乎不是由 SD 读卡器触发的。另外,例如,我离开了一个多星期,它在第五天就崩溃了,尽管没有人使用它。我不太记得上次崩溃是什么时候,但我想那是几周前的事。
我不知道如何处理这个日志输出,甚至也不知道如何谷歌它。我有点担心追踪硬件故障可能会有些困难,但我真的不知道从哪里开始。
升级到较新的 Fedora 不是一个选择,因为 F30libc
与 Chrome 的 Flash 不兼容,遗憾的是我仍然需要 Flash,这是我自己没有选择的。
那么,我怎样才能确定这里出了什么问题呢?
更新
Memtest86+ v4.3.7 没有发现 RAM 有任何问题,并且我已将内核升级到5.3.1-150.vanilla.knurd.1.fc29.x86_64
.我愿意接受任何其他建议。
答案1
看Vedran Sego 的 IP 地址查找。我假设你不是来自中国,所以我的第一步是禁用 SSH
sudo -i
systmctl disable ssh
systemctl stop ssh
在此之后测试正常运行时间,而不必担心根接管。如果正常运行时间延长,并且您需要 SSH,请执行与上述步骤相反的操作后禁用通过 SSH 进行 root 访问