有人能够在没有 NVLink 桥的情况下与 NCCL(caffe、tensorflow)并行运行多张 NVidia RTX 2080Ti 卡吗?

有人能够在没有 NVLink 桥的情况下与 NCCL(caffe、tensorflow)并行运行多张 NVidia RTX 2080Ti 卡吗?

我正在尝试在具有 8x GPU 卡的机器上运行 DNN 训练。但是,似乎 RTX 2080Ti 卡(可能是 Titan RTX)在没有 NVLink 桥的情况下无法并行运行。这意味着您最多只能并行运行 2 张卡来分配计算。看起来限制似乎来自 NVidia 驱动程序不支持的 PCIe 芯片组,或者这些卡根本不支持 PCIe 上的 P2P(请参阅 nvidia 论坛帖子https://devtalk.nvidia.com/default/topic/1051602/cuda-programming-and-performance/using-multiple-rtx-2080-ti-cards-in-parallel-not-possible-/?offset=3#5337543)在我的系统上我得到

# nvidia-smi topo -p2p r
        GPU0 GPU1 GPU2 GPU3 GPU4 GPU5 GPU6 GPU7
 GPU0 X CNS CNS CNS CNS CNS CNS CNS
 GPU1 CNS X CNS CNS CNS CNS CNS CNS
 GPU2 CNS CNS X CNS CNS CNS CNS CNS
 GPU3 CNS CNS CNS X CNS CNS CNS CNS
 GPU4 CNS CNS CNS CNS X CNS CNS CNS
 GPU5 中枢神经系统 中枢神经系统 中枢神经系统 中枢神经系统 X 中枢神经系统 中枢神经系统
 GPU6 CNS CNS CNS CNS CNS CNS X CNS
 GPU7 CNS CNS CNS CNS CNS CNS CNS X

传奇:

  X = 自我
  OK = 状态正常
  CNS = 芯片组不受支持
  GNS = GPU 不受支持
  TNS = 拓扑不受支持
  NS = 不支持
  U=未知
# nvidia-smi topo -m
        GPU0 GPU1 GPU2 GPU3 GPU4 GPU5 GPU6 GPU7 CPU 亲和性
GPU0 X PIX PIX PIX SYS SYS SYS 0-19,40-59
GPU1 PIX X PIX PIX 系统 系统 系统 系统 0-19,40-59
GPU2 PIX PIX X PIX SYS SYS SYS 0-19,40-59
GPU3 PIX PIX PIX X SYS SYS SYS 0-19,40-59

GPU4 SYS SYS SYS X PIX PIX PIX 20-39,60-79
GPU5 SYS SYS SYS PIX X PIX PIX 20-39,60-79
GPU6 SYS SYS SYS PIX PIX X PIX 20-39,60-79
GPU7 SYS SYS SYS PIX PIX PIX X 20-39,60-79

传奇:

  X = 自我
  SYS = 遍历 PCIe 的连接以及 NUMA 节点之间的 SMP 互连(例如 QPI/UPI)
  NODE = 遍历 PCIe 的连接以及 NUMA 节点内 PCIe 主桥之间的互连
  PHB = 穿越 PCIe 以及 PCIe 主机桥(通常是 CPU)的连接
  PXB = 穿越多个 PCIe 交换机的连接(不穿越 PCIe 主机桥)
  PIX = 穿越单个 PCIe 交换机的连接
  NV# = 遍历一组绑定的 NVLink 的连接

我想知道是否有人通过 PCIe 成功实现了点对点 GPU 通信?您使用什么 MB?

答案1

不幸的是,NVIDIA 官方取消了 RTX 卡上的 PCIe P2P 支持。您必须购买更昂贵的专业卡才能获得适当的 PCIE P2P 支持。这不是芯片组的问题。

来源

相关内容