了解任何网络 [即 infiniband] 最大文件传输速度

Question

只要仔细配置，就有可能通过 NVMEoF 获得持续的、接近链接速度的读/写性能。仔细的配置包括以下内容：您是否有足够的 PCIe 带宽来处理您的 NIC？一个 PCIe Gen 3 x 16 通道插槽的速度仅足以支持一个 100 Gbit Infiniband 链路。然后，您必须确保有足够的 PCIe 带宽、足够的 PCIe 通道，以便将数据传输到 NVME 阵列，并且如果您使用 4 通道 NVME 设备，则可以将设备分布在计算机中可用的通道上。您需要确保 NIC 和 NVME 阵列位于计算机中的同一 PCIe 主机上。您需要考虑还有哪些其他设备正在使用该 PCIe 带宽。

对于 Infiniband 和其他高速网络，将内核、CPU、中断等排除在数据传输之外变得很重要。它们往往是限制因素。最糟糕的情况之一是 CPU 必须接触缓冲区。

Infiniband 的一项关键优势是无需任何 CPU 干预即可进行远程直接内存访问 (RDMA)。您通过网络接口卡 NIC 将数据从内存移动到远程计算机 NIC，然后直接 DMA 到内存中。

首先确保 Infiniband、NIC 和 NVidia (Mellanox) OFED 配置正确并且达到宣传的 100 Gbps。您可以使用 NVidia 提供的“perftest”来完成此操作。

Infiniband 发送带宽 ib_send_bw 测试是一个起点。

在一台 Infiniband 连接的计算机上仅运行“ib_send_bw”。在另一台计算机上运行“ib_send_bw XXX.XXX.XXX.XXX”，其中 XXX.XXX.XXX.XXX 是第一台计算机的 Infiband 适配器的 IP 地址。

https://www.ibm.com/docs/fi/linux-on-systems?topic=linuxonibm/performance/howtos/verifyrdma.htm

您还可以使用 iperf3 或 netcat (nc) 来进行估计。例如这个问题和答案：

https://askubuntu.com/questions/7976/how-do-you-test-the-network-speed- Between-two-boxes

rsync默认要进行delta/diff比较，这涉及到CPU读取缓冲区。压缩或将 rsync 与 ssh 结合使用会降低性能，因为 CPU 需要再次读取和操作所有数据。使用无需 CPU 参与即可传输数据的技术有很多优点，例如 NVME over Fabric (NVMEoF)、iSCSI 等。

Answer 1