VPS 每隔几天就会冻结

VPS 每隔几天就会冻结

我负责的一个应用程序/服务器经常出现问题。我基本上有一个 VPS,其中包含运行我的应用程序所需的所有堆栈(nginx + postgresql + ruby​​ + ruby​​ on rails + Passenger),由 ansible 维护。该服务器有问题,每 2 天就会冻结一次。它没有在端口 80 或 22 上接收任何传入连接(所以我甚至无法使用 ssh 连接到它)。唯一的解决方案是重新启动它。我忽略了这个问题,因为我确定那台机器直接出了问题,换到新机器就可以解决问题。

我最近稍微更改了我的 ansible playbook,并将我的应用程序划分为 3 个独立的服务器。我确信问题不会发生,但不幸的是,它再次出现,更糟糕的是,它影响了所有三台机器!我使用相同的 ansible 角色对所有这三台服务器进行基本服务器配置,但没有什么危险。只是一些基本的东西,如用户创建、生成 SSH 密钥等。无论如何,还有更多 - 现在,对于这三台新服务器,即使重新启动也无法解决该问题,从 Azure Panel 重新启动后,我仍然无法通过 80 或 22 端口连接到这三台机器中的任何一台。

我显然无法调试这些新服务器的日志,因为它们无法访问,但我仍然在运行旧服务器,所以检查是什么导致它冻结可能会有所帮助?我只是无法在日志中找到任何东西(或者我不知道应该在哪里寻找任何线索)。

服务器使用Ubuntu 14.04

答案1

很多事情都可能出错。以下是我的做法:

  • 保持登录状态然后跑tail -f <every log file that might be helpful>。你至少会看到它死后发生的最后的事情。

  • 重启后查看日志。还要查看dmesg。您必须向后滚动才能看到重启前的最后一个事件。

  • 查看控制台日志。AWS 在 EC2 控制台中(并通过 API)提供这些日志,我不知道 Azure 如何处理它们。

相关内容