AWS 架构建议 - 具有共享数据库/文件系统的多个 EC2 实例，可动态启动和停止

Question 1

您的设置听起来确实合理。我建议您考虑使用 API 网关来“托管”您的 API，并考虑一下它是否适合您。您还可以考虑将重负载 EC2 实例放在 Autoscaling 组中，并让您的控制 Lambda 与其交互，而不是直接与实例交互。

S3 和 EFS 是不同的数据存储解决方案。S3 是对象存储，而 EFS 是文件存储。S3 并非完全可挂载，尽管它可能看起来像是通过不同的实用程序呈现的。无论是正确的使用 S3 还是 EFS 取决于您如何使用其中的文件。

对于数据库，您可以考虑使用 RDS，也许可以使用可突发实例类或无服务器选项之一。但这取决于您的预算和用例。

Answer

您的设置听起来确实合理。我建议您考虑使用 API 网关来“托管”您的 API，并考虑一下它是否适合您。您还可以考虑将重负载 EC2 实例放在 Autoscaling 组中，并让您的控制 Lambda 与其交互，而不是直接与实例交互。

S3 和 EFS 是不同的数据存储解决方案。S3 是对象存储，而 EFS 是文件存储。S3 并非完全可挂载，尽管它可能看起来像是通过不同的实用程序呈现的。无论是正确的使用 S3 还是 EFS 取决于您如何使用其中的文件。

对于数据库，您可以考虑使用 RDS，也许可以使用可突发实例类或无服务器选项之一。但这取决于您的预算和用例。

Question 2

总体而言，在云中尝试使用服务而不是服务器是明智之举。您必须关注成本，但它可以使解决方案更强大、更快速、更合规。

对于你的工作量，我有几点想法：

您可以使用 AWS Step Functions 之类的编排器调用许多 AWS lambda 函数来进行计算吗？我确实注意到 lambda 可能是 AWS 上计算时间最昂贵的，因此可能并不理想。如果设置了正确的限制和合适的工作负载，也许您可以启动 10,000 个 lambda 并在 15 分钟内并行完成作业。
除了 EFS / S3，如何创建一个黄金 EC2 映像 / AMI，然后为每个作业启动一个足够大的现货 / 动态 EC2 实例来处理该作业，并在作业完成后关闭？Lambda 也许可以根据某种类型的事件来协调作业？这样可以避免数据传输费用 - 虽然不确定是否要向 EBS / S3 收取费用。现货计算非常便宜，如果您正确选择区域 / AZ / 实例大小，中断应该很少发生。中断的实例将被关闭，EBS 卷将被保留，因此如果您的作业定期写入磁盘并可以重新启动，这将更好地发挥作用。

我或许还会花一些时间来优化这项巨大的工作。

Answer

总体而言，在云中尝试使用服务而不是服务器是明智之举。您必须关注成本，但它可以使解决方案更强大、更快速、更合规。

对于你的工作量，我有几点想法：

您可以使用 AWS Step Functions 之类的编排器调用许多 AWS lambda 函数来进行计算吗？我确实注意到 lambda 可能是 AWS 上计算时间最昂贵的，因此可能并不理想。如果设置了正确的限制和合适的工作负载，也许您可以启动 10,000 个 lambda 并在 15 分钟内并行完成作业。
除了 EFS / S3，如何创建一个黄金 EC2 映像 / AMI，然后为每个作业启动一个足够大的现货 / 动态 EC2 实例来处理该作业，并在作业完成后关闭？Lambda 也许可以根据某种类型的事件来协调作业？这样可以避免数据传输费用 - 虽然不确定是否要向 EBS / S3 收取费用。现货计算非常便宜，如果您正确选择区域 / AZ / 实例大小，中断应该很少发生。中断的实例将被关闭，EBS 卷将被保留，因此如果您的作业定期写入磁盘并可以重新启动，这将更好地发挥作用。

我或许还会花一些时间来优化这项巨大的工作。

相关内容