排查 AWS EC2 实例重启问题

排查 AWS EC2 实例重启问题

我所在的公司有一台 AWS EC2 机器,昨天刚刚重启。

我查看了 /var/log 中的各种文件,但没有找到任何可以解释为何或谁重新启动了实例的内容。

当我查看 system.journal 文件时,我发现重启前的最后一条消息和重启后的第一条消息之间存在 10 分钟的间隔。

我应该如何进行进一步调查?任何有关使用 CloudWatch 或 CloudTrail 的提示都将不胜感激。

答案1

AWS 可以因上述任何原因重启 EC2 实例这里

  • 实例未通过一项或两项状态检查。
  • 托管您的实例的底层硬件有故障,Amazon EC2 重新启动了该实例以将其移至新的、健康的硬件。
  • 您的实例发生了计划维护,需要重新启动。
  • 服务器内的用户或应用程序重新启动了实例。

链接的帖子还讨论了使用 CloudTrail 来确定导致重启的原因。您不太可能在 CloudWatch 中找到任何东西(除非您将日志转发到 CloudWatch)

相关内容