Ubuntu 服务器监控和故障排除

Ubuntu 服务器监控和故障排除

我有一个运行 Ubuntu 10 的 rackspace 云服务器。http 前端是 nginx 1.0.2。Play!Framework 上运行着多个 java web 应用程序实例,而这些实例又建立在 Netty 堆栈上。

我发现与 nginx 的 http 连接时不时会中断,我怀疑是某个 Java Web 应用程序实例导致了问题。但是它中断了与 nginx 的 http 连接,这很奇怪。我对这个问题非常担心。有人对如何监控和排除系统故障有什么建议吗?

目前,我认为一些带有 http 接口的工具可以显示每个进程的 CPU/内存/打开的文件等的历史数据,对我有很大帮助。

你有什么建议吗?

提前致谢,Green

答案1

我认为 Munin 是正确的

http://munin-monitoring.org/

因为它易于安装,具有许多功能,如电子邮件通知和许多插件。

其他人认为是 nagios ^^ 但是 nagios 有点难,而且更适合服务器基础设施

希腊公牛

穆宁

相关内容