使用 Nagios 进行冗余监控

Question

关于 Nagions 主/从设置，有一些很棒的文档可供参考：http://nagios.sourceforge.net/download/contrib/documentation/misc/HighAvailability/NagiosHA_EN.pdf

在我的用例中，我使用了一种略有不同的方法，我发现这种方法在发生故障时更容易设置和恢复。在 DC 1 中，有一个运行 Nagios 的 VM，它检查 DC 1 和 2 中的所有内容。它使用 DRBD 设置为复制到热备用 VM 以及 DC 2 中的第三个从属。我使用 DRBD 的原因是它可以复制整个块设备（甚至通过 VPN 跨数据中心复制），因此恢复非常简单。它还使配置变得非常简单，不需要在 Nagios 中进行复杂的配置。有多种方法可以自动执行故障节点的故障转移，例如 keepalived、corosync、heartbeat（如果您希望它完全自动化）。

在 DC 2 中，我们有完全相同的设置，只是相反。

我的环境不是很大（450 台服务器），所以这个设置运行良好。在更大的环境中，可能需要将监控分布在 Nagios 节点上才能达到可接受的性能目标。

Answer 1

关于 Nagions 主/从设置，有一些很棒的文档可供参考：http://nagios.sourceforge.net/download/contrib/documentation/misc/HighAvailability/NagiosHA_EN.pdf

在我的用例中，我使用了一种略有不同的方法，我发现这种方法在发生故障时更容易设置和恢复。在 DC 1 中，有一个运行 Nagios 的 VM，它检查 DC 1 和 2 中的所有内容。它使用 DRBD 设置为复制到热备用 VM 以及 DC 2 中的第三个从属。我使用 DRBD 的原因是它可以复制整个块设备（甚至通过 VPN 跨数据中心复制），因此恢复非常简单。它还使配置变得非常简单，不需要在 Nagios 中进行复杂的配置。有多种方法可以自动执行故障节点的故障转移，例如 keepalived、corosync、heartbeat（如果您希望它完全自动化）。

在 DC 2 中，我们有完全相同的设置，只是相反。

我的环境不是很大（450 台服务器），所以这个设置运行良好。在更大的环境中，可能需要将监控分布在 Nagios 节点上才能达到可接受的性能目标。

使用 Nagios 进行冗余监控

答案1

相关内容