橡树岭国家实验室的 Summit 为何有 2,414,592 个核心?

橡树岭国家实验室的 Summit 为何有 2,414,592 个核心?

Top500 表示 Summit 拥有 2,414,592 个核心:https://www.top500.org/system/179397。但他们有 4608 个节点,9216 个芯片(每个节点有 2 个芯片),每个芯片有 22 个核心。这就是 202,752 个核心。2,414,592 这个数字到底从何而来?

同样,Sierra 的网页上明确指出有 190,080 个核心:https://computation.llnl.gov/computers/sierra。但top500说他们有100多万。

这是我在这里的第一个问题,所以如果这不是“服务器”问题,请接受我的歉意。我曾在 Meta 上询问在哪里可以问 HPC 问题:https://meta.stackexchange.com/questions/327714/where-should-hpc-questions-about-schedulers-go-stackoverflow-superuser-comput,但目前还没有专门针对 HPC 的堆栈交换。

答案1

用粗略的数量级估计来验证这个数字。一个机架中有 20 个双插槽服务器,每个插槽有 20 个 CPU 核心。对于一台计算机来说,300 个机架是巨大的,这需要数兆瓦的电力消耗。因此,超过 200,000 个 CPU 核心是可能的。

GPU 流式多处理器也算作核心,至少对 Linpack 来说是这样。下一个平台揭开 Summit 超级计算机的面纱

Summit 使用的 Power9 芯片有 22 个核心,运行频率为 3.1 GHz,每个节点有一对核心,4,608 个节点共有 202,752 个核心。机器上有六个 Volta GPU 加速器,总共有 221 万个 SM。加起来,Summit 机器中有 241 万个“核心”,这是 Linpack 人员在计算时得出的。

通过一次简单的乘法就能获得机器性能的日子已经一去不复返了。

相关内容