我在生产环境中的所有服务器上运行了活动的 Zabbix 代理,但其中两个无法连接到 Zabbix 服务器。我只能在 Zabbix 日志中查看
active check configuration update from [<zabbix server>:10051] started to fail (cannot connect to [[<zabbix server>]:10051]: [4] Interrupted system call)
这似乎是一个非常常见的错误消息!我遇到的困难是弄清楚为什么我的数据库集群中的节点 2 连接正常,但配置相同的节点 1 却连接不上。设置相当简单,唯一的复杂之处在于我的 Zabbix 服务器位于与我的代理 (10.10.0.0/24) 不同的网络 (192.168.10.0/24) 上,因此我必须相应地配置必要的路由。网络之间没有代理。
我已检查过的内容:
- Zabbix 代理在任何需要的地方运行
- 代理和服务器配置中的主机名匹配
- 服务器配置中的 IP 地址正确
- 正确的路线显示在和
route
我的代理和服务器上ip route
/etc/sysconfig/network-scripts/route-eth0
- 服务器或代理上没有规则
iptables
来阻止 10050 或 10051 上的流量 - 服务器可以通过10050
ping
和10050 访问代理telnet
- 所有代理(正常工作和损坏)都无法通过 访问服务器
ping
,但未telnet
安装在任何代理上。我宁愿推迟在生产服务器上安装东西,直到下一个维护窗口!
我错过了什么?