Zabbix主动检查监控问题

Zabbix主动检查监控问题

我是 zabbix 监控工具的新手,在配置基于主动检查的监控时遇到了一些问题。Zabbix 服务器托管在 AWS 云中,要监控的服务器位于数据中心。这些服务器之间配置了某种防火墙。我在客户端服务器上安装了 zabbix-agent,并在 zabbix UI 中添加了主机。当我检查日志时,我只能看到错误消息
Get value from agent failed: cannot connect to {server:10050}: interrupted system call.

这是我目前所做的。
1. 在服务器中安装 zabbix 代理。
2. 在选项“服务器”中设置 Zabbix 服务器 IP
3. 将 StartAgent 设置为 0
4. 将 ServerActive 设置为 zabbix 服务器 IP
5. 提供主机名(与运行 zabbix 代理的主机名相同) 6. 在 zabbix UI 中添加代理
7. 使用 zabbix-agent(active) 更改操作系统和 zabbix 代理项的模板
8. 重新启动客户端和服务器服务。

Zabbix 服务器和客户端安装在 RHEL 中。

当我从端口为 10050/10051 的客户端远程登录到服务器时,可以连接,反之则无法连接。客户端未启用/允许 zabbix 端口。但对于配置主动检查,根据我经历的许多线程,这并非必需。从客户端日志中,我可以看到定义的检查正在执行,但 UI 仍然显示红色。

谢谢您的回复 :) 有什么方法可以确认配置的活动检查是否正确。我可以看到客户端已获取配置检查列表并对其进行处理。请查看代理日志中附加的日志。

 23679:20160107:172925.431 In evaluate_function() function:'HOSTNAME:proc.num[,,run].avg(5m)'
 23679:20160107:172925.431 In evaluate_function() function:'HOSTNAME:proc.num[].avg(5m)'
 23679:20160107:172925.431 In evaluate_function() function:'HOSTNAME:system.cpu.load[percpu,avg1].avg(5m)'
 23679:20160107:172925.432 In evaluate_function() function:'HOSTNAME:system.cpu.util[,iowait].avg(5m)'
 23679:20160107:172925.432 In evaluate_function() function:'HOSTNAME:system.swap.size[,pfree].last(0)'
 23679:20160107:172925.432 In evaluate_function() function:'HOSTNAME:vm.memory.size[available].last(0)'
 23679:20160107:172925.432 In evaluate_function() function:'HOSTNAME:vfs.fs.inode[/,pfree].last(0)'
 23679:20160107:172925.432 In evaluate_function() function:'HOSTNAME:vfs.fs.inode[/boot,pfree].last(0)'
 23679:20160107:172925.432 In evaluate_function() function:'HOSTNAME:vfs.fs.inode[/tmp,pfree].last(0)'
 23679:20160107:172925.432 In evaluate_function() function:'HOSTNAME:vfs.fs.inode[/var,pfree].last(0)'
 23679:20160107:172925.432 In evaluate_function() function:'HOSTNAME:vfs.fs.inode[/var/tmp,pfree].last(0)'
 23679:20160107:172925.433 In evaluate_function() function:'HOSTNAME:vfs.fs.inode[/apps,pfree].last(0)'
 23679:20160107:172925.433 In evaluate_function() function:'HOSTNAME:vfs.fs.size[/,pfree].last(0)'
 23679:20160107:172925.433 In evaluate_function() function:'HOSTNAME:vfs.fs.size[/boot,pfree].last(0)'
 23679:20160107:172925.433 In evaluate_function() function:'HOSTNAME:vfs.fs.size[/tmp,pfree].last(0)'
 23679:20160107:172925.433 In evaluate_function() function:'HOSTNAME:vfs.fs.size[/var,pfree].last(0)'
 23679:20160107:172925.433 In evaluate_function() function:'HOSTNAME:vfs.fs.size[/var/tmp,pfree].last(0)'
 23679:20160107:172925.433 In evaluate_function() function:'HOSTNAME:vfs.fs.size[/apps,pfree].last(0)'

如果我将现有的 zabbix 服务器升级到 Zabbix-3.0,并且稳定版本是否可用,是否有可能出现故障?我应该考虑哪些步骤来确保配置的主动检查是正确的。

答案1

Zabbix 代理检查有两种:被动检查和主动检查。被动检查是指 Zabbix 服务器连接到 Zabbix 代理时进行的检查。主动检查是指 Zabbix 代理连接到 Zabbix 服务器时进行的检查。

从代理获取值失败:无法连接到{server:10050}:中断的系统调用。Zabbix 前端的红色部分Z与被动检查有关。此图标不反映主动检查的状态。因此,如果主动检查成功为您服务,则没问题。

Z例如,如果仅使用主动检查,则红色不会重置,这是一个已知问题。该问题最近已在 Zabbix 3.0 中修复,具体版本如下:ZBX-1916

相关内容