我有一台 Ubuntu 服务器,它时不时会重启。我注意到它每 3 周左右重启一次。我感觉这种情况发生得越来越频繁,我想准确了解问题所在以及发生的频率。
我正在考虑配置一封在服务器启动时发送的电子邮件,但我想在这里问这个问题,看看监控服务器的最佳实践是什么。注意到您可以使用 Bootmail 或使用 cron 的脚本配置服务器以发送电子邮件。我还注意到了 Nagios,但它似乎更复杂和详细。监控 Ubuntu 服务器的最佳实践是什么?我正在寻找一些简单但灵活且功能强大的东西。shell 脚本越少越好。
答案1
这是 Linux 监视工具的列表: (http://www.cyberciti.biz/tips/top-linux-monitoring-tools.html)。如您所见,还有 Nagios。您没有指定要监控的服务。
如果您需要日志读取器,可以尝试 Splunk,它对于少量日志数据是免费的。对于 Web 服务器,我会选择众多 Web 统计程序之一。希望这会有所帮助。对于数据库,您需要监控可用磁盘空间、表空间大小和 CPU 过载。对于简单的文件服务器,我会选择 mail-ping(cron 作业会向您的手机发送电子邮件/短信。)
监控有很多个级别,所以这很大程度上取决于您的服务器提供的服务、您需要达到的 SLA 以及您可以花费的金钱。
答案2
尝试海狮它是一个免费的 Linux 监控系统。你只需要安装一个代理程序就可以了。它可以监控任何自定义命令、shell 脚本、日志输出等……当我需要找出 Ubuntu 服务器上在特定时间出了什么问题时,它帮了我大忙。我可以轻松找出当时正在运行的哪些进程导致了高 CPU、内存和 I/O 等待。我推荐这个工具,因为它直观且易于安装和设置。