服务器重启后,每四个小时 TCP 连接都无法在两个方向上建立。问题持续几分钟然后消失。syslog 中似乎没有相关事件,即使在 dmesg 中也是如此。同时 ICMP ping 仍然正常,即使使用 -s 1500(mtu 为 1500)。我推测某个进程打开了太多连接,并每十秒使用 ss -at4 设置监控脚本,但没有发现任何异常,没有出现新的可疑进程和连接。发行版类似于 Debian Stretch。链接已绑定。我可以检查什么来解决这个问题?UPD。我发现 4 小时周期从 networking.service 重启开始计算,而不仅仅是重启本身。另外值得一提的是,此主机上的网络接口通过 OVS 连接。TCP 内核选项和限制完好无损,与其他节点相同。
答案1
我不知道为什么会在这个时间间隔发生这种情况,但我最终发现我的网络 IP 是相同的。令我惊讶的是,系统不会像 Windows 那样发出有关其网络中相同 IP 的信号
UPD 罪魁祸首是网络中 Cisco 设备上的虚拟接口。Cisco 的默认 ARP 超时时间为 14400 秒(四小时)。