哪些 AWS 实例最适合高效运行 Python 代码？

Question 1

有许多方面需要考虑：

您的应用程序是否可以利用多核 CPU? 更大的 EC2 实例会为您提供更多 CPU 核心，但通常不会提供更快的单核性能。确保您的应用程序可以执行并行处理充分利用所有可用的 CPU 核心。

如果不能运行并行处理，看看是否可以将数据拆分成多个独立批次并并行运行应用程序的多个副本，每个副本都使用一个核心。
你在哪里存储您的数据? 如果他们EBS 卷相比之下，它可能相当慢实例本地存储（又名临时存储)。并非所有 EC2 实例都提供实例存储 - 检查Amazon EC2 实例类型表格中的详细信息。将数据复制到实例存储之前进行处理，以提高数据访问性能。

另一个选择是使用存储优化实例和预配置 IOPS EBS 卷但这通常非常昂贵。
如果你的应用做了很多联网在计算过程中，请确保你在这方面也没有受到限制。选择一个具有高网络性能。

对于这样的实验，你可能会发现使用Spot 实例这可以为您节省高达 90% 的运行成本（或者以相同的价格可以为您提供更大的实例）。但是请注意一些权衡，主要是如果对特定实例类型的需求增加，实例可能会随时终止。

希望有帮助:)

Answer

有许多方面需要考虑：

您的应用程序是否可以利用多核 CPU? 更大的 EC2 实例会为您提供更多 CPU 核心，但通常不会提供更快的单核性能。确保您的应用程序可以执行并行处理充分利用所有可用的 CPU 核心。

如果不能运行并行处理，看看是否可以将数据拆分成多个独立批次并并行运行应用程序的多个副本，每个副本都使用一个核心。
你在哪里存储您的数据? 如果他们EBS 卷相比之下，它可能相当慢实例本地存储（又名临时存储)。并非所有 EC2 实例都提供实例存储 - 检查Amazon EC2 实例类型表格中的详细信息。将数据复制到实例存储之前进行处理，以提高数据访问性能。

另一个选择是使用存储优化实例和预配置 IOPS EBS 卷但这通常非常昂贵。
如果你的应用做了很多联网在计算过程中，请确保你在这方面也没有受到限制。选择一个具有高网络性能。

对于这样的实验，你可能会发现使用Spot 实例这可以为您节省高达 90% 的运行成本（或者以相同的价格可以为您提供更大的实例）。但是请注意一些权衡，主要是如果对特定实例类型的需求增加，实例可能会随时终止。

希望有帮助:)

Question 2

如果您正在读取/写入大量文件到磁盘，难怪 AWS 中的脚本速度较慢，因为那里的 io 操作通常依赖于网络连接（搜索 EBS）。

您可以尝试 i3 实例类型，它们提供快速的 SSD 磁盘。但更正确的方法是调查您的案例中的瓶颈是什么：cpu、ram 或 io，然后调整脚本来克服它，这将节省您的金钱和时间。

Answer

如果您正在读取/写入大量文件到磁盘，难怪 AWS 中的脚本速度较慢，因为那里的 io 操作通常依赖于网络连接（搜索 EBS）。

您可以尝试 i3 实例类型，它们提供快速的 SSD 磁盘。但更正确的方法是调查您的案例中的瓶颈是什么：cpu、ram 或 io，然后调整脚本来克服它，这将节省您的金钱和时间。

相关内容