CPU内存带宽应该和显存带宽匹配吗?

CPU内存带宽应该和显存带宽匹配吗?

我发现视频内存带宽是显卡性能的一个很好的指标。我检查了一些示例,它与基准点的相关性很好。

我在另一篇文章中看到,GPU 只能使用视频内存,如果 CPU 想要 GPU 为其计算某些内容,就应该将 RAM 的内容复制到视频内存中。

这种复制是否经常发生?这是否意味着 CPU 的内存带宽应该以某种方式与显卡的带宽相匹配,否则 CPU 会限制 GPU 性能?

答案1

这是一个相对容易验证的假设。有 3 个数字可以参考:

  1. CPU 到内存的带宽
  2. PCIe 带宽(CPU 到 GPU)
  3. GPU 带宽

CPU 带宽数据可以在制造商网站上找到,PCIe x16 带宽是一个已知数据,GPU 制造商也会发布这些数据。

因此对于高端i7-8700使用 x16PCIe3.0 链接和Nvidia 1080具体数字如下

  1. 48GB/s(CPU 到内存)
  2. ~16GB/s(PCIe 带宽(CPU 到 GPU))
  3. 320GB/s(GPU带宽)

因此,虽然 CPU 与其本地内存具有相对较好的带宽,并且 GPU 与其内存具有大量链接,但看起来这两个设备之间的链接是有限的。

对于游戏来说这并不是什么问题,游戏只需用纹理和场景数据加载 GPU,之后带宽要求相对较小。

对于 GPGPU 任务,CPU 和 GPU 之间的有限带宽链接是否存在问题完全取决于您的数据。

答案是,这取决于您使用 GPU 执行的操作。

答案2

有两种类型的视频卡,根据其内存使用情况而有所区别。

融合的

集成 GPU 不使用自己的 RAM,而是利用系统的内存。坦率地说,它的主要优点是价格便宜。集成显卡属于低端产品,因此在玩 3D 游戏时可能需要调低图形设置。

投入的

专用或分立 GPU 拥有独立的视频内存源,不会影响系统使用的 RAM。该内存与计算机的系统内存完全分开。专用卡适用于严肃游戏或专业图形设计师。

结论

对于集成 GPU,只有一个内存,因此不需要复制。对于专用 GPU,两个内存之间没有连接,因此带宽不需要匹配,并且仍然没有复制。

相关内容