CentOS54 服务器消失了,没有 ssh,没有 ping,控制台挂起。日志中没有任何内容

CentOS54 服务器消失了,没有 ssh,没有 ping,控制台挂起。日志中没有任何内容

今天早上,我的一个 nfs 服务器从监控中消失了。我检查了一下,控制台挂了,没有响应,显然是崩溃了。

我关闭电源并检查了系统日志,它似乎刚刚崩溃了,但没有任何迹象表明原因。

是否有任何我可以应用的内核或调试设置,以尝试捕获任何将来再次发生或此问题。(或有关如何进行的任何建议)

答案1

如果它完全崩溃,日志中没有任何内容,我强烈怀疑它与硬件有关。我会重新安装内存,检查风扇是否正常运行以冷却服务器,如果它是服务器级系统,则使用诊断程序检查设备(我知道戴尔服务器通常有一系列可以运行的测试,但这取决于型号,无论是在 BIOS 中还是在启动分区中或可启动 CD 中)

我很少、很少、很少遇到 Linux 完全崩溃且没有内核转储或日志中没有记录的情况。我遇到过系统因控制器故障、内存溢出或其他硬件相关问题而崩溃的情况,这些情况很容易导致您所描述的情况。

答案2

就像 Bart 说的,检查硬件。另外,有时无响应的机器可能因为负载过大而处于这种状态。我看到一些邮件服务器就是这样。检查网络,如果 NFS 在执行某项操作时网络中断,则可能会严重崩溃。

如果您再次需要对机器执行此操作,请记住 Magic Sysrq 键和 Raising Elephants Is So Utterly Boring 短语。ALT+SysRQ+ 可以在各方面都死机的 Linux 机器上创造奇迹。短语是记住要与 ALT+SysRQ 一起使用的命令:

R: take control of the keyboard
E: sends SIGTERM to all processes
I: sends SIGKILL to all processes
S: Sync (flush caches to disk, very important)
U: remount all FS read only
B: reboot!

相关内容