Nvidia Pascal 架构:DMA 大小/主机系统 RAM 的最大数量?

Nvidia Pascal 架构:DMA 大小/主机系统 RAM 的最大数量?

我们计划构建一对多 GPU Linux 服务器,用于机器学习和数据科学任务。根据我们的要求,我们需要在这些机器中放入大量 RAM;我们计划使用 24 个 64GiB LRDIMM,总共 1.5TiB。对于 GPU,我们打算使用 Titan X 以获得最佳性价比,但根据Nvidia 的 Linux 驱动程序文档,当前一代显卡无法处理超过 1TiB 的主机系统 RAM。我听到“传言”说 Pascal 架构将具有增强的寻址能力,但我找不到任何可靠的文档来证实或反驳这一点。如果这是真的,我们可能会选择较新的 GTX 1080 显卡,即使它们的显卡 RAM 少了 4GiB。

因此我的问题是:我是否缺少一些有关 Pascal 寻址功能的文档?

或者,有人可以使用 GTX 1080 来
grep DMA /proc/driver/nvidia/gpus/domain:bus:device.function/information 帮我运行吗?

答案1

回答我自己的问题以供将来参考。我们决定使用 GTX 1080 卡。在驱动程序版本下367.57,它们报告了以下 DMA 功能:

$ grep DMA /proc/driver/nvidia/gpus/0000\:04\:00.0/information
DMA Size:    47 bits
DMA Mask:    0x7fffffffffff

因此,它们应该能够处理高达约 140 TB 的主机系统 RAM——对于我们的用例来说已经足够了。

相关内容