我们新安装了带有代理 (RHEL6) 的 Zabbix 3.4.7 (RHEL7),但每天我们都会看到代理崩溃,zabbix_proxy.log 显示以下错误
noname.xml:5:解析器错误:开始和结束标记不匹配:链接第 4 行和头部 ^ noname.xml:10:解析器错误:开始和结束标记不匹配:头部第 2 行和 html ^ noname.xml:5:解析器错误:开始和结束标记不匹配:链接第 4 行和头部 ^ noname.xml:10:解析器错误:开始和结束标记不匹配:头部第 2 行和 html ^ noname.xml:5:解析器错误:开始和结束标记不匹配:链接第 4 行和头部 ^ noname.xml:10:解析器错误:开始和结束标记不匹配:头部第 2 行和 html
24795:20180917:181036.334 收到信号 [信号:11(SIGSEGV),原因:1,refaddr:0x40]。崩溃...
24795:20180917:181036.334 === 回溯: ===
24795:20180917:181036.335 11:/usr/sbin/zabbix_proxy:vmware 收集器 6 已更新 0,已删除 0 个 VMware 服务,耗时 0.000008 秒,正在查询 VMware 服务 [0x7f82ad51a2ca]
24795:20180917:181036.335 10:/usr/sbin/zabbix_proxy:vmware 收集器 6 已更新 0,已删除 0 个 VMware 服务,耗时 0.000008 秒,正在查询 VMware 服务 [0x7f82ad51a6e1]
24795:20180917:181036.335 9:/lib64/libc.so.6(+0x3f112326a0)[0x7f82a99206a0]
24795:20180917:181036.335 8:/usr/sbin/zabbix_proxy:vmware collector 6 已更新 0,已删除 0 个 VMware 服务,耗时 0.000008 秒,正在查询 VMware 服务 [0x7f82ad4bd465]
24795:20180917:181036.335 7:/usr/sbin/zabbix_proxy:vmware 收集器 #6 已更新 0,已删除 0 个 VMware 服务,耗时 0.000008 秒,正在查询 VMware 服务 [0x7f82ad4bf5c8]
24795:20180917:181036.335 6:/usr/sbin/zabbix_proxy:vmware 收集器 #6 已更新 0,已删除 0 个 VMware 服务,耗时 0.000008 秒,正在查询 VMware 服务 [0x7f82ad4c12a2]
24795:20180917:181036.335 5:/usr/sbin/zabbix_proxy:vmware 收集器 6 已更新 0,已删除 0 个 VMware 服务,耗时 0.000008 秒,正在查询 VMware 服务 [0x7f82ad529fdb]
24795:20180917:181036.335 4:/usr/sbin/zabbix_proxy:vmware collector 6 已更新 0,已删除 0 个 VMware 服务,耗时 0.000008 秒,正在查询 VMware 服务 [0x7f82ad48336b]
24795:20180917:181036.335 3:/usr/sbin/zabbix_proxy:vmware collector 6 已更新 0,已删除 0 个 VMware 服务,耗时 0.000008 秒,正在查询 VMware 服务 [0x7f82ad5199e8]
24795:20180917:181036.335 2:/usr/sbin/zabbix_proxy:vmware collector 6 已更新 0,已删除 0 个 VMware 服务,耗时 0.000008 秒,正在查询 VMware 服务 [0x7f82ad482832]
24795:20180917:181036.335 1:/lib64/libc.so.6(__libc_start_main + 0xfd)[0x7f82a990cd5d]
24795:20180917:181036.335 0:/usr/sbin/zabbix_proxy:vmware 收集器 #6 已更新 0,已删除 0 个 VMware 服务,耗时 0.000008 秒,正在查询 VMware 服务 [0x7f82ad481019]
我们正在通过代理监控 VMWare,看起来这些消息可能是相关的。
奇怪的是,每天大约 18:10 都会发生崩溃,这表明一定是某些日常检查或计划工作导致了问题。
是否有人遇到过类似的事情,如果没有,有人可以给我一些指点,告诉我还可以在哪里查找可能导致崩溃的原因?