我想监控服务器的健康状况,即 CPU、内存、交换和磁盘使用情况。如果我使用简单的 Linux 命令(如 top、iostat 等)以及使用 nagios 插件,会有什么区别......
答案1
使用 Linux 命令更像是一种时间上的片段,而不是一种监控工具。Nagios 允许您对特定项目(如 CPU、内存、交换区等)进行检查。当某些东西超出特定指标时,您可以发出警报(电子邮件、短信等)。例如,如果您的驱动器已满到 80%,您可以收到警报并采取措施。另一个例子是,如果您的 CPU 使用率飙升,您可以收到警报。
但是,Nagios 和简单的 Linux 工具只能提供一小部分时间。Nagios 可以让您了解一段时间内发生的情况。如果您想知道服务器在一段时间内正在做什么,这在“监控”中可能更有用。您可以考虑使用 Cacti 之类的工具。Cacti 基本上类似于 Nagios,只是它不会向您发出警报,而是绘制一段时间内的性能图表。因此,如果您的 CPU 在某个时间段内急剧上升,您可以查看该时间段内的服务器,并可能发现正在发生的其他问题,例如 RAM 使用率增加。
您可以在这里查看 Cacti:http://www.cacti.net/
答案2
nagios 是一个可以在您的服务器出现问题时向您发出警报的系统。它可以向您发送电子邮件,如果您愿意,还可以将电子邮件转发到短信中。
使用诸如 top/iostat 之类的命令总是要求您去那里,执行它们,并查看输出。