我遇到了一个非常奇怪的情况,Linux 服务器 (Fedora 38) 每 30 分钟 10 秒就会离线一次。无法 ping 通它,一两秒钟内也无法 ping 通任何东西,然后又过了 30 分钟 10 秒又恢复正常。
现在,这不是什么大问题,但我只是想彻底弄清楚,而且我已经用尽了下一步可以尝试的方法。
在我知道服务器将离线之前的 10 秒,我让 TCPDump 运行了 20 秒,但其中没有任何明显的迹象。
我检查了正在运行的服务,也没有发现任何异常。
有人知道发生了什么事以及我接下来可以检查什么吗?
谢谢,安迪
答案1
“那里没有什么明显的东西”是什么意思?
想必您已经检查过日志,以确保主机已启动、网络已连接并且在该窗口期间已分配 IP 地址?如果每次事件开始之间的时间间隔确实是 1810 秒(而不是 1800 秒然后停机 10 秒),则表明这不是计划任务。
根据您提供的信息,最有可能的原因是 DHCP 配置不稳定。但您已经检查过日志了吗?
您忘记告诉我们您是否在同一网络上还有其他东西/您监控主机的位置与主机本身之间有什么。您还忘记告诉我们它离线了多长时间。
我很想在事件发生时频繁地在主机上运行 ping/ip a/iptables -L。