通过互连器访问内存的延迟

Question

您的单节点数为 90 ns 本地 vs 370 ns 其他套接字，这似乎是合理的。但是，我认为 Infiniband 的 600 ns 应该是端到端的，通过交换机连接到不同的框架。

远程数据报 600 纳秒非常快。本地内存访问通常约为 100 纳秒。而同一节点的不同套接字可能多 200 纳秒。

单一映像多节点计算机可以通过软件中的 RDMA 或 NUMA 系统中的硬件互连进行内存访问。

InfiniBand 是 RDMA 的一种传输方式。2014 年左右，Mellanox 声称Infiband EDR 端到端为 500 ns。这只是猜测，但他们的营销可能会混淆数字。NIC 上引用的典型端到端时间为 600 纳秒，加上路径上每个额外交换机的 150 纳秒。

或者，是的，NUMA 互连对于多节点系统来说是一种特殊的东西，但它们确实存在。对于 x86，有 SGI UV 系列。 NUMAlink 7 互连声称实现 500 ns 远程节点访问在 POWER 平台上，IBM 可以使用 NVLink 连接节点，尽管我不知道它的延迟。

关于您对以太网或 Infiniband 商品传输的选择，这很可能限制了您使用 RDMA 感知应用程序。支持透明单映像系统的 NUMA 硬件往往是定制的。

Answer 1

您的单节点数为 90 ns 本地 vs 370 ns 其他套接字，这似乎是合理的。但是，我认为 Infiniband 的 600 ns 应该是端到端的，通过交换机连接到不同的框架。

远程数据报 600 纳秒非常快。本地内存访问通常约为 100 纳秒。而同一节点的不同套接字可能多 200 纳秒。

单一映像多节点计算机可以通过软件中的 RDMA 或 NUMA 系统中的硬件互连进行内存访问。

InfiniBand 是 RDMA 的一种传输方式。2014 年左右，Mellanox 声称Infiband EDR 端到端为 500 ns。这只是猜测，但他们的营销可能会混淆数字。NIC 上引用的典型端到端时间为 600 纳秒，加上路径上每个额外交换机的 150 纳秒。

或者，是的，NUMA 互连对于多节点系统来说是一种特殊的东西，但它们确实存在。对于 x86，有 SGI UV 系列。 NUMAlink 7 互连声称实现 500 ns 远程节点访问在 POWER 平台上，IBM 可以使用 NVLink 连接节点，尽管我不知道它的延迟。

关于您对以太网或 Infiniband 商品传输的选择，这很可能限制了您使用 RDMA 感知应用程序。支持透明单映像系统的 NUMA 硬件往往是定制的。

相关内容