我正在尝试在具有 8x GPU 卡的机器上运行 DNN 训练。但是,似乎 RTX 2080Ti 卡(可能是 Titan RTX)在没有 NVLink 桥的情况下无法并行运行。这意味着您最多只能并行运行 2 张卡来分配计算。看起来限制似乎来自 NVidia 驱动程序不支持的 PCIe 芯片组,或者这些卡根本不支持 PCIe 上的 P2P(请参阅 nvidia 论坛帖子https://devtalk.nvidia.com/default/topic/1051602/cuda-programming-and-performance/using-multiple-rtx-2080-ti-cards-in-parallel-not-possible-/?offset=3#5337543)在我的系统上我得到
# nvidia-smi topo -p2p r GPU0 GPU1 GPU2 GPU3 GPU4 GPU5 GPU6 GPU7 GPU0 X CNS CNS CNS CNS CNS CNS CNS GPU1 CNS X CNS CNS CNS CNS CNS CNS GPU2 CNS CNS X CNS CNS CNS CNS CNS GPU3 CNS CNS CNS X CNS CNS CNS CNS GPU4 CNS CNS CNS CNS X CNS CNS CNS GPU5 中枢神经系统 中枢神经系统 中枢神经系统 中枢神经系统 X 中枢神经系统 中枢神经系统 GPU6 CNS CNS CNS CNS CNS CNS X CNS GPU7 CNS CNS CNS CNS CNS CNS CNS X 传奇: X = 自我 OK = 状态正常 CNS = 芯片组不受支持 GNS = GPU 不受支持 TNS = 拓扑不受支持 NS = 不支持 U=未知
# nvidia-smi topo -m GPU0 GPU1 GPU2 GPU3 GPU4 GPU5 GPU6 GPU7 CPU 亲和性 GPU0 X PIX PIX PIX SYS SYS SYS 0-19,40-59 GPU1 PIX X PIX PIX 系统 系统 系统 系统 0-19,40-59 GPU2 PIX PIX X PIX SYS SYS SYS 0-19,40-59 GPU3 PIX PIX PIX X SYS SYS SYS 0-19,40-59 GPU4 SYS SYS SYS X PIX PIX PIX 20-39,60-79 GPU5 SYS SYS SYS PIX X PIX PIX 20-39,60-79 GPU6 SYS SYS SYS PIX PIX X PIX 20-39,60-79 GPU7 SYS SYS SYS PIX PIX PIX X 20-39,60-79 传奇: X = 自我 SYS = 遍历 PCIe 的连接以及 NUMA 节点之间的 SMP 互连(例如 QPI/UPI) NODE = 遍历 PCIe 的连接以及 NUMA 节点内 PCIe 主桥之间的互连 PHB = 穿越 PCIe 以及 PCIe 主机桥(通常是 CPU)的连接 PXB = 穿越多个 PCIe 交换机的连接(不穿越 PCIe 主机桥) PIX = 穿越单个 PCIe 交换机的连接 NV# = 遍历一组绑定的 NVLink 的连接
我想知道是否有人通过 PCIe 成功实现了点对点 GPU 通信?您使用什么 MB?
答案1
不幸的是,NVIDIA 官方取消了 RTX 卡上的 PCIe P2P 支持。您必须购买更昂贵的专业卡才能获得适当的 PCIE P2P 支持。这不是芯片组的问题。