服务器CPU过高

服务器CPU过高

最近我不得不重启我的服务器,因为它没有响应。我查看了日志,但没有找到任何有价值的信息来判断错误出在哪里。

droplet CPU 连续几个小时处于 100% 状态。以下是屏幕截图:

在此处输入图片描述

当 droplet 出现问题时,网站不可用,shell 也无法访问。

我不知道我还能做什么来找到错误或可能的原因。我应该从哪里开始查找?哪些特定的日志在这里可能更有用?

现在重新启动后一切都正常......但它可能会再次发生。

请帮助我。谢谢。

答案1

在使用 Nagios 和类似程序之前,我建议您安装sar以监控您的服务器。它基本上不需要配置,但同时它会收集有关服务器上正在运行/发生的事情的许多关键统计数据。

答案2

首先,你有没有监控工具,比如纳吉奥斯,实时突出显示这些事件?这将是一个很好的建议,您可以配置它来监控您的服务器,它可以执行许多 SNMP 命令,例如:

服务监控

事件处理

多主机监控

有关详细信息,请查看以下附加组件这里

======= 
USAGE: 
======= 

./checkProcessesviaSNMP.sh <community-string> <remote-host> <process-names> <warning> <critical> <type> 

该工具应该能够监控您服务器上的大量实时事件并通过电子邮件向您发出警报(假设您配置了 SMTP)。

此解决方案不会阻止故障,但应该向您提供正在发生的事情的实时警报。

相关内容