我有一个运行 Ubuntu 10 的 rackspace 云服务器。http 前端是 nginx 1.0.2。Play!Framework 上运行着多个 java web 应用程序实例,而这些实例又建立在 Netty 堆栈上。
我发现与 nginx 的 http 连接时不时会中断,我怀疑是某个 Java Web 应用程序实例导致了问题。但是它中断了与 nginx 的 http 连接,这很奇怪。我对这个问题非常担心。有人对如何监控和排除系统故障有什么建议吗?
目前,我认为一些带有 http 接口的工具可以显示每个进程的 CPU/内存/打开的文件等的历史数据,对我有很大帮助。
你有什么建议吗?
提前致谢,Green
答案1
我认为 Munin 是正确的
因为它易于安装,具有许多功能,如电子邮件通知和许多插件。
其他人认为是 nagios ^^ 但是 nagios 有点难,而且更适合服务器基础设施
希腊公牛