我们在 Amazon EC2 上运行了大量 Ubuntu 实例,在过去两个月中,我们发现其中一些实例变得无响应且无法访问。没有 SSH、没有 ping 响应等。最终,作为最后的手段,重新启动这些实例有所帮助。
所有受影响的实例都是基于 EBS 的。日志中没有关于故障原因的迹象。我们一直怀疑这些实例可能以某种方式断开了与 EBS 卷的连接。
我的问题是:
- 这有可能吗(我的意思是:一个实例失去了与其 EBS 卷的连接)?
- 我该如何调试这个问题并确保情况确实如此?
- 最重要的是:我该如何防止这种情况发生?
答案1
到目前为止,EBS 是 AWS 上最可靠的选择。它不仅更好,还可以轻松拍摄快照并重新连接到另一个实例。我们有非常大的基于 EBS 的 Ec2 实例,供媒体网站使用,从未出现过这样的问题。除此之外,亚马逊保证这项服务的正常运行时间为 99.95%,如果出现故障,将退款。
回答您的问题。