排查 Amazon EC2 重启问题

排查 Amazon EC2 重启问题

几个月来,我们的服务器 (CentOS) 一直在 EC2 中运行。运行一直很顺利,直到今天我们收到服务器不可用(无法访问 HTTP 服务)的警报。因此,我尝试通过 SSH 进入该框,但也超时了。我登录到 EC2 控制台,它显示实例正在运行,但系统日志中没有任何内容。我注意到一件奇怪的事情是,即使我们有一个连接到它的弹性 IP(显示在弹性 IP 管理区域中),实例详细信息并未显示与该实例关联的 EIP。

我查看了消息日志,在收到警报时我看到的最后一件事是 dhclient 续订了租约。我猜可能是网络出了什么问题。

我该如何检查这是否是问题所在,或者是否有其他问题导致我们的实例停止响应?

答案1

简而言之,您不能。如果您有金牌支持,您可以开具一张票据,有时他们会给您更多信息,但除此之外,您所能做的就是终止实例并启动一个新实例。

EC2 有时会出现此类故障。我们只是让实例处于待命状态,以便在发生这种情况时接管。

答案2

除了保持实例处于待机状态之外,适当的自动扩展指标是否能实现相同的解决方案?

相关内容