我发现 EC2 上的 CentOS 5 服务器在没有我命令的情况下重新启动了。重新启动当天我甚至没有登录。当我在 linux 中查看“last”时,它显示:
jeroen pts/0 128.97....... Thu Apr 7 15:02 - 16:28 (01:25)
reboot system boot 2.6.18-xenU-ec2- Wed Apr 6 15:48 (1+05:27)
jeroen pts/2 128.97....... Tue Apr 5 19:31 - 23:17 (03:45)
所以看起来那天没有人登录。有什么想法可以解释一下可能发生了什么吗?EC2 在任何情况下都会重启实例吗?或者它可能被黑客入侵了?
答案1
当 Amazon 希望停用运行您的实例的物理服务器时,偶尔会发生这种情况。他们可能要关闭服务器以更换出现故障的硬件组件,或者服务器可能只是到了使用寿命的尽头。无论哪种方式,据我了解,他们的流程大致如下:
- 物理服务器被标记为已退役,因此不会在其上启动任何新实例。
- 如果可以(例如他们没有处理严重的硬件故障),亚马逊将等待一段时间,看看服务器上运行的实例是否自行关闭或重新启动(重新启动 EC2 实例通常会导致它在不同的物理服务器上启动)。
- 该期限结束后,亚马逊将强制剩余实例重新启动并将它们移至其他物理服务器。
作为一般经验法则,由于这个以及环境中的其他怪癖,您应该将 EC2 上运行的任何单个服务器视为临时服务器。任何服务器都可能随时重新启动或完全消失。因此,使用类似厨师或者木偶,拥有可靠的监控,并设计应用程序来解决故障问题至关重要。