如何在 Nagios 中监控 Microsoft SQL 集群可用性?

如何在 Nagios 中监控 Microsoft SQL 集群可用性?

我们在集群设置中运行一个旨在与 Microsoft SQL Server 集成的系统。目前,我们在 Nagios 下监控两个数据库节点,除了数据库主机检查外,一切都很好:

check_tcp -H $主机地址$ -p 1433

可能不能像这样直接监控故障转移集群。我应该如何监控集群的数据库可用性?

答案1

对于群集上的 SQL Server,必须将其安装为虚拟节点,无论是默认实例还是命名实例。因此,TCP 检查(其中主机名是具有正确端口的虚拟名称)应该有效。例如,如果我有一个包含物理节点的双节点群集:

  • 物理1
  • 物理2

不要为 SQL Server 监视其中任何一个。安装 SQL Server 时,假设我选择了 Virtual1 的虚拟节点名称,那么您要监视的就是 Virtual1。如果 SQL Server 已启动,则群集已启动。如果您只是想检查群集是否已启动,请查找群集组本身的网络名称。

答案2

为什么不使用 mssql-plugin 连接到与您的应用程序相同的 ip/主机名?为了完成监控,我将为虚拟 ip 添加一个主机,并为每个集群节点添加两个主机。因此,如果您的一个节点发生故障,您会收到通知,但您知道集群仍然正常,因为您没有收到通知。

相关内容