关于主动/被动故障转移,有哪些实用程序?

关于主动/被动故障转移,有哪些实用程序?

我即将配置两台 Nagios 服务器,其中一台是热备用或故障转移单元。它将定期检查活动的 Nagios 服务器,并在发生故障时需要窃取其 IP 地址。

我的第一反应是使用 bash 和 cron 编写脚本,这应该相当简单。有没有更好的实用程序来接管另一台服务器的 IP?也许可以让之前处于活动状态的服务器在重新上线时窃取其 IP。

答案1

看一眼linux-ha. 它是一个集群软件,允许您执行您计划的操作而无需编写任何脚本。

您基本上会在 linux-ha 配置中定义一个服务,它由一个虚拟 ip 地址和 nagios 守护程序组成。使用 linux-ha,您可以在两个系统上安装一些代理。它们交换心跳并检测活动节点的故障。在这种情况下,linux-ha 将在故障节点上为您的 ip 和 nagios 运行关闭脚本(默认初始化脚本),并在备用服务器上运行启动。

配置有非常详细的文档,并且有一些示例可以帮助您运行集群。

答案2

您可以使用中心,这是一个免费的 Nagios 配置工具。作为其功能的一部分,它可以从中央控制台管理多个 Nagios 服务器。

如果您只是“共享” IP,那么您将在两台服务器上都有日志。查看警报历史记录时,您必须滚动浏览 2 台服务器,这效率不高。您还必须手动同步配置文件夹和插件文件夹。

相关内容