Top500 表示 Summit 拥有 2,414,592 个核心:https://www.top500.org/system/179397。但他们有 4608 个节点,9216 个芯片(每个节点有 2 个芯片),每个芯片有 22 个核心。这就是 202,752 个核心。2,414,592 这个数字到底从何而来?
同样,Sierra 的网页上明确指出有 190,080 个核心:https://computation.llnl.gov/computers/sierra。但top500说他们有100多万。
这是我在这里的第一个问题,所以如果这不是“服务器”问题,请接受我的歉意。我曾在 Meta 上询问在哪里可以问 HPC 问题:https://meta.stackexchange.com/questions/327714/where-should-hpc-questions-about-schedulers-go-stackoverflow-superuser-comput,但目前还没有专门针对 HPC 的堆栈交换。
答案1
用粗略的数量级估计来验证这个数字。一个机架中有 20 个双插槽服务器,每个插槽有 20 个 CPU 核心。对于一台计算机来说,300 个机架是巨大的,这需要数兆瓦的电力消耗。因此,超过 200,000 个 CPU 核心是可能的。
GPU 流式多处理器也算作核心,至少对 Linpack 来说是这样。下一个平台揭开 Summit 超级计算机的面纱:
Summit 使用的 Power9 芯片有 22 个核心,运行频率为 3.1 GHz,每个节点有一对核心,4,608 个节点共有 202,752 个核心。机器上有六个 Volta GPU 加速器,总共有 221 万个 SM。加起来,Summit 机器中有 241 万个“核心”,这是 Linpack 人员在计算时得出的。
通过一次简单的乘法就能获得机器性能的日子已经一去不复返了。