我目前正在为一个运行近 40 个网站的客户管理一些服务器,其中近一半是 WordPress 网站。我们目前使用来自 Linode 的 4 个 VPS,网站相对均匀地分布在 4 台服务器上。这些服务器运行的是最新版本的 CentOS,每台服务器大约有 1GB 的内存。
我们一直遇到反复发生的中断,但昨晚的中断是最奇怪的。网站瘫痪了,所以我登录了 Webmin,我们的网络服务器、数据库服务器、DNS 服务器等都瘫痪了。我重新启动它们并通过 SSH 登录,结果发现服务器正在缓慢运行。运行 TOP 显示没有任何东西对服务器造成严重影响,而且资源似乎一点也不短缺。查看 Linode 图表,在中断之前一切都很好(据我所见),然后 CPU% IO、网络活动等急剧下降。就在那之前,由于我们进行了夜间备份,所以磁盘 IO 相当高,但这是唯一的主要活动。
我有点不知该从何下手。客户非常沮丧,这是理所当然的。
您有何建议来帮助排除故障并解决这个问题?
非常感谢您的帮助。
答案1
我会查看我的日志并联系 Linode 寻求帮助。
答案2
你看过日志了吗?
可能是内存用完了,然后 OOM killer 终止了它们。快速检查:运行dmesg
,应该很容易看到。
顺便提一下,我不明白为什么要运行 4 个 VPS,每个 1GB 大,而不是运行一个带有 4GB RAM 的 VPS。