我有两个 nginx 充当 Web 代理服务器,两者都已完全更新 Ubuntu 18.04.4。它们处于故障转移状态保持活跃所以如果其中一个服务器挂了,另一个服务器就会接管。它们位于 DMZ 网络中,并将请求转发到不同子网中的多个 Web 服务器。我无法直接从公司 LAN 访问它们,我必须从 Web 服务器网络中的另一台计算机进行代理。
我遇到了一些无法理解的事情:掌握节点有时不再响应 Web 请求。我无法再从 Web 服务器子网进行 ssh 连接,但如果我登录到从属服务器并 ssh 连接,它就会立即工作。服务器负载非常低,一切看起来都很正常。一旦我停止keepalived
(并且 Web 流量通过虚拟 IP 路由到从属服务器),一切都会恢复正常,我可以从 LAN 进行 ssh 连接。
我在 Zabbix 中添加了 TCP 连接监控,但代理位于 Web 服务器网络中,因此在停机期间无法连接。爆发前连接似乎正常。
在写入时,我看到 Zabbix 报告了另一次断电,即使是强连接仍然在从属代理上路由,因此问题不太可能是连接耗尽。在此期间我无法从从属连接。
两台服务器都是托管在外包管理环境中的虚拟机,因此我不知道虚拟化的详细信息。
如果有人知道我可以在哪里查看问题可能出在哪里...谢谢
答案1
最终,一些有趣的系统管理员将主机的 IP 分配给了 DMZ 中的另一台设备