我已经在 10 个节点和一个虚拟主机上安装了 Sun Grid Engine。
现在我必须在投入生产之前监控所有资源,但我不知道哪种方法最好。我试过使用 xml-qstat,但它似乎不稳定。
有什么提示或建议吗?
有人有这方面的经验吗?
谢谢。
答案1
答案2
答案3
仅供参考,还有 Munin (http://munin-monitoring.org/) 是非常好的。
答案4
听起来你对指标比对正常运行时间或可用性更感兴趣。Circonus (http://circonus.com/) 非常适合这里。您可以关联几乎任何指标,这些指标可以通过 Resmon XML DTD 导入。