AWS Graviton 处理器:哪些加密规格是硬件加速的?

AWS Graviton 处理器:哪些加密规格是硬件加速的?

在测试 Graviton 实例时,与更便宜/更小的 Intel/AMD 实例相比,AES/SHA 函数的 CPU 开销似乎明显更高。这些进程支持硬件加速吗?

答案1

在寻找我的问题的过程中,我找到了一个解决方案。来源很难找到,但引用一篇有点随意的 2018 年新闻文章

其 CPU 内核基于 Arm 2015 年推出的 Cortex-A72 设计,主频为 2.3GHz。它们是 64 位、Armv8-A、小端、非 NUMA,并具有浮点运算硬件加速、SIMD 以及 AES、SHA-1、SHA-256、GCM 和 CRC-32 算法。

通过测试,我发现了其他进程的一个共同点——性能在不同代中存在很大差异。起初我没考虑引力子对比Graviton2对比Graviton3SHA-256,但它们都支持不同级别的硬件加速。对每秒 1MB - 32MB 有效载荷的快速测试(即 L2 和 L3 缓存,谢谢阿南德科技) 显示16vCPU不同代 Graviton 的等级均为 6+ GB/s。 基准测试结果

还测试了较低1vCPU2vCPU较低实例,但性能不一致 < 1GB/s。不确定资源共享是否影响结果。

答案2

Arm 团队有一篇非常有趣的文章,名为AWS Graviton3 提供领先的 AES-GCM 加密性能他们分享了以下内容:

Arm Neoverse 平台现在能够利用 Armv8-A 中的加密扩展来加速重要的加密操作。本博客介绍了流行的高级加密标准 (AES) 算法的 Galois/Counter Mode (GCM)。并展示了如何充分利用这些指令并充分发挥 Arm Neoverse 平台的潜力。

他们分享了一个基准测试,比较了 c6g、c7g 和 c6i(第三代英特尔至强可扩展处理器)之间的加密性能。也许使用那里的说明,我们可以了解更多信息,特别是关于Armv8-A 内核中的加密扩展

基准测试的结果非常有趣:

总体而言,c7g 上的 AES-GCM 性能比 c6i 高出约 100%。c6i 在单线程测试时性能更高。但是,它在多线程下扩展性不佳。在 c6i 上使用超线程时,如果一个超线程执行 AVX512 代码,则内核必须降低其频率,这会减慢同一内核的兄弟超线程上的执行速度。c6g 上的性能略低于 c6i,但在多线程上可以赶上 c6i。 c6g、c6i、c7g 不同线程数 aes-gcm 性能对比

相关内容