CentOS 5.5 上的服务器挂起

CentOS 5.5 上的服务器挂起

我在服务器上运行 CentOS 5.5。它运行多个 VMware 虚拟机和一个 NFS 服务器。

偶尔,比如今天,它会挂起。/var/log/messages 中没有任何内容表明存在任何问题。(我确实注意到 /var/log/messages 不是按时间顺序排列的。)

有什么建议去哪里寻找原因吗?

答案1

这些信息不足以进行诊断。如果系统确实挂起 - 即在网络和本地控制台上无响应 - 并且系统日志中没有任何内容或dmesg提供任何线索,那么我会假设您遇到了硬件故障,并开始运行硬件供应商提供的诊断工具。坏的 RAM 或 CPU 肯定会导致这种行为。

答案2

问题是 RAM 故障。运行 memtest86 并发现故障。对 DIMM 进行了 RMA 处理并换了新的。其中一些也出现了内存故障。对这些也进行了 RMA 处理,现在一切都稳定了。

答案3

如果您正在运行窗口管理器(gnome 或 kde),我发现机器硬锁定存在问题。

问题是 gnome 屏幕保护程序导致某种问题,导致机器完全锁定并停止响应任何连接。禁用屏幕保护程序后,锁定停止。

查看 xorg 日志和 gdm 日志(如果您使用 gnome)。

另外,检查 /var/logs 中所有日志文件的时间戳,查看在锁定时是否有任何日志被写入。

你看过 cron 了吗?是否有进程自动运行并导致死机?

答案4

你可能只需要彻底清洁主板。我遇到了同样的情况;完全冻结;完全挂起,日志中没有任何内容,鼠标或键盘没有响应,只有冻结的屏幕和挂起的 CPU,完全没有响应。日志什么也没显示。

我进行了彻底的清洁,包括拆下主板,断开所有连接。清洁过程非常非常仔细。拆下与内部风扇相连的 CPU 散热器意味着我必须使用我在当地无线电商店购买的导热膏(北极银 5),将散热器表面重新安装到 CPU 顶部。

我还使用纯外用酒精(91%)清除了 CPU 和散热器上的旧导热膏。

我已经从英特尔和北极银公司下载了说明。

它必须非常非常干净,并且有非常具体的说明。

按照我下载的说明,将所有内容重新组合在一起,运行良好。

这让我免于扔掉电脑,因为之前我以为电脑出了什么问题,但其实电脑只是脏兮兮的。风扇罩下面是主板上的脏东西。这肯定是造成短路的原因,因为灰尘和污垢/污垢是导电的。

相关内容