如何设置 Zabbix 来监控 SQL Server 故障转移主动-被动集群?

如何设置 Zabbix 来监控 SQL Server 故障转移主动-被动集群?

它应该很简单,所以很可能是我的方法完全错误,希望有人能引导我走向正确的方向。

我们有一个 Zabbix 2.0.3 服务器实例设置来监控一堆不同的服务器,但现在我们需要设置它来监控和通知有关 SQL Server 2008 R2 故障转移主动-被动集群的任何警报。

本质上,这是一个 2 服务器集群,在给定时间内只有一个节点可以处于“活动”状态,为所有 SQL Server 相关的请求提供服务,而另一个服务器则处于“睡眠”状态,并且从任何登录该服务器的人的角度来看 - 所有 SQL Server 相关服务都处于停止状态。

我们尝试在两台服务器上设置 Zabbix 代理,使用 SQL Server 2005 模板(我们找不到任何 2008 特定的模板,而 2005 模板似乎总是可以很好地监控 2008 R2 实例)并为两台服务器配置 Zabbix 服务器,但最终我们不断收到警报,因为服务器目前是集群中的被动服务器。我们已经能够查找实际监控故障转移的各种方法,但我们无法找到任何有关如何指示 Zabbix 的指导,在这种特定情况下,组中只有一台服务器预计处于在线状态,而另一台服务器可以被丢弃并且不会发出任何警报。

希望我说清楚了。谢谢您的指导。我没有主意了。

答案1

我对 SQL Server 集群一无所知,但可能有一个与活动节点关联的服务 IP 地址,在发生 HA 事件时,该地址会故障转移到另一个节点。不要在两个节点(zabbix 中的主机)上监控 SQL Server,而是创建一个具有服务 IP 地址的新主机“SQL Server Active”,并仅在该主机上监控 SQL Server。

答案2

我在 zabbix 中有 3 个主机用于监控集群。1 和 2 当然是节点。第 3 个是集群。我监控它们,检查集群当前的主机名,因此它引入了活动节点主机名。我还找到了一些通过 WMI 检查状态的方法。只需询问谷歌 :)

相关内容