我们计划构建一对多 GPU Linux 服务器,用于机器学习和数据科学任务。根据我们的要求,我们需要在这些机器中放入大量 RAM;我们计划使用 24 个 64GiB LRDIMM,总共 1.5TiB。对于 GPU,我们打算使用 Titan X 以获得最佳性价比,但根据Nvidia 的 Linux 驱动程序文档,当前一代显卡无法处理超过 1TiB 的主机系统 RAM。我听到“传言”说 Pascal 架构将具有增强的寻址能力,但我找不到任何可靠的文档来证实或反驳这一点。如果这是真的,我们可能会选择较新的 GTX 1080 显卡,即使它们的显卡 RAM 少了 4GiB。
因此我的问题是:我是否缺少一些有关 Pascal 寻址功能的文档?
或者,有人可以使用 GTX 1080 来
grep DMA /proc/driver/nvidia/gpus/domain:bus:device.function/information
帮我运行吗?
答案1
回答我自己的问题以供将来参考。我们决定使用 GTX 1080 卡。在驱动程序版本下367.57
,它们报告了以下 DMA 功能:
$ grep DMA /proc/driver/nvidia/gpus/0000\:04\:00.0/information
DMA Size: 47 bits
DMA Mask: 0x7fffffffffff
因此,它们应该能够处理高达约 140 TB 的主机系统 RAM——对于我们的用例来说已经足够了。