我正在使用一个基于 SUSE Linux 的系统,该系统全天候运行,并且已经运行了大约 3 年,尽管我不能说它在这段时间内没有重新启动过。6
月 9 日,似乎发生了某种网站关闭,但我不知道这次关闭是如何处理的。
从那时起,发生了无数次瞬间重启。
几乎在所有可以想象的测试情况下都会发生故障,例如用户应用程序是否正在运行、是否存档数据、是否记录新数据、在 20 次或更多次崩溃后运行 fsck 或者只是什么都不做。
RAM 已被更换。
由于 CPU 散热器上的冷却风扇噪音太大,因此将其更换(尽管在仅约 20 毫米远的地方有一个更大的风扇在吹着它)。
电源已更换,绿线已接地,以防止其关闭。
这似乎使得重启频率稍微降低一些。
显然,虽然我没有这样做,但 fsck [可能] 已在其上运行 [250GB 驱动器具有大约 220GB 的数据分区],但我不知道是否已检查所有分区。但显然它已连续运行了 2 天。
有人能指出哪些问题会导致 Linux 立即死亡并重新启动吗?
答案1
我觉得这听起来像是硬件问题。可能是温度、电源或主板问题。
您可以检查日志/var/log/*
或dmesg
命令输出以寻找线索
RAM 已更换。CPU 散热器上一个老旧的冷却风扇已更换,因为噪音太大,虽然有一个更大的风扇在它上面吹着风,但距离它只有大约 20 毫米。电源已更换,绿线已接地,以防止其关闭,但这仅意味着重启延迟会减少一点。
我会检查流明传感器或在“/proc/acpi/thermal_zone“(如果适用于您)是否有任何过热迹象。