我有一台 Ubuntu VPS,最近它在处理器满负荷运转的情况下开始变得无响应。
不幸的是,我不知道是什么原因导致了这个问题,我正在寻找一些指针来确定是什么原因导致了这个问题,以便我可以修复它。
- 我不知道它锁定时正在运行什么,但有什么方法可以弄清楚吗?
- 我可以采取哪些程序/日志记录以便在下次发生问题时能够诊断该问题?
答案1
在我的公司,我们在每台服务器上都安装了一个简单的 cron 脚本来检查平均负载。如果平均负载开始超过某个点,它会向我们发送电子邮件,这样我们就可以登录服务器并查找有问题的进程。 top
这是我输入的第一个命令。
我相信我们检查了 5 分钟的平均负载,但如果您发现您的服务器很快就受到冲击,您可能需要您的脚本来监视 1 分钟的平均负载。