监控多个Linux服务器并自动恢复服务或重启

监控多个Linux服务器并自动恢复服务或重启

可能重复:
您使用什么工具来监控您的服务器?

我想监控大约 30-50 台服务器。其中包括:

  • MySQL 正在运行吗?
  • Apache2 正在运行吗?
  • ping 值有多高?

如果任何服务出现故障(无法 ping 通、MySQL 关闭等),我希望收到一封包含详细状态报告的电子邮件。

我也希望看到一个漂亮的网络界面:)

此外:我希望系统尝试重新启动服务器(目前,当服务器出现故障时,我必须手动重新启动它)。

这可能吗?如果可以,怎么做?

答案1

这个领域有几种工具。根据你的问题的复杂程度和你想学习的程度来决定解决方案。 纳吉奥斯@Matteo 提到过。它是一款非常好的工具,跨平台,功能强大,但配置方面有点复杂。

禅道OSS据称配置起来更简单。

监控更轻量,能够处理您的任务。这三种方法都具有通知和采取补救措施的能力。

答案2

Nagios 是一个选项。它有许多插件可以检查进程、网络等。它有一个 Web 界面,除了通知之外,您还可以定义要执行的操作。

答案3

另一个可能的解决方案是扎比克斯- 它功能丰富,可以通过基于 Web 的前端进行全面管理,配置比 Nagios 更简单。此外,它可以运行远程命令,因此在发生故障时可以非常轻松地重新启动服务(或整个服务器)。

相关内容