我有 8 台服务器,分布在两个子网(两个独立的交换机)中,所有服务器都具有最长 24 小时的正常运行时间。这些是无盘机器,从 NFS 服务器安装其文件系统。它们在启动 24 小时后就会离线,大约几分钟。无论它们在一天中的什么时间开始,它们都会在 24 小时后同时停止。
我尝试错开他们的启动时间,看看 24 小时周期的一致性如何,结果发现它们都以与启动时相同的模式下降。
当我检查日志时,我没有发现任何机器正在关闭的证据,也没有发现任何问题的迹象。我相信这是因为崩溃的原因是切断与 NFS 的连接。
已尝试更新到最新内核。
我想知道是否有任何服务或其他潜在原因可能导致这些症状。请帮忙!