EC2 的平均故障间隔时间是多少？

Question 1

没有公布 MTBF 统计数据。“比你希望的更频繁”是你所能得到的最好结果。除此之外，其他发帖者还提供了关于如何处理应用程序架构的出色答案。

Answer

没有公布 MTBF 统计数据。“比你希望的更频繁”是你所能得到的最好结果。除此之外，其他发帖者还提供了关于如何处理应用程序架构的出色答案。

Question 2

我通常预计 EC2 实例的 MTBF 会比我购买并放置在数据中心的高端硬件更高。

最大的不同是，我可以设计我的 EC2 设置，这样当一个实例发生故障时，我可以在收到警报并连接到互联网的几分钟内启动一个新的实例。这与我以前所做的工作形成了鲜明对比，以前当一个服务器在 40 分钟路程外的托管服务器发生故障时，我必须开车去那里，调试硬件问题，安装替换部件（如果我手头正好有的话）。

例如，如果实例的底层硬件出现故障，您可以将其丢弃，并使用以下几个命令切换到新硬件：

更换 EC2 实例硬件的更简单方法
http://alestic.com/2011/02/ec2-move-hardware

因此，尽管我有时会设计复制和自动恢复或故障转移，但其他时候我往往会发现自己面临着一点停机风险，因为手动恢复太容易了。

记录/编写实例设置（软件安装/配置），以便您可以随时重现它。定期拍摄快照。定期备份您的数据（除了快照之外）。将备份副本保存在异地（EC2 之外）。

如果您需要额外的正常运行时间，请选择更复杂的复制、冗余、故障转移、自动扩展架构，AWS 也比使用物理硬件更容易实现这些架构。

Answer