我正在使用节点到节点的 Infiniband 连接构建一个双节点集群。
我有 HP InfiniBand FDR/以太网 10/40Gb 2 端口 544FLR-QSFP(P/N:649282-B21)和富士通 D3118-A22 GS-2 主板,配备双 Xeon E5-2690 和 Ubuntu 16.04.4。
问题是我无法使用 lspci 找到 HCA。我想知道这是否是由于硬件兼容性还是我遗漏了什么。
谢谢
答案1
HP 44FLR-QSFP 基于 Mellanox ConnectX-3 VPI。尚未使用 HP 版本,但您应该能够使用 Mellanox 工具检查 HCA 板。请参阅此链接
尝试 mstflint、mstconfig 等检查“Mellanox Inbox Drivers”下的文档和您的 Linux 发行版的发行说明。
- 将 VPI hca/NIC 的模式设置为 IB
- 加载 IB 内核驱动程序
- 在其中一个节点上安装 OpenSM