我发现视频内存带宽是显卡性能的一个很好的指标。我检查了一些示例,它与基准点的相关性很好。
我在另一篇文章中看到,GPU 只能使用视频内存,如果 CPU 想要 GPU 为其计算某些内容,就应该将 RAM 的内容复制到视频内存中。
这种复制是否经常发生?这是否意味着 CPU 的内存带宽应该以某种方式与显卡的带宽相匹配,否则 CPU 会限制 GPU 性能?
答案1
这是一个相对容易验证的假设。有 3 个数字可以参考:
- CPU 到内存的带宽
- PCIe 带宽(CPU 到 GPU)
- GPU 带宽
CPU 带宽数据可以在制造商网站上找到,PCIe x16 带宽是一个已知数据,GPU 制造商也会发布这些数据。
因此对于高端i7-8700使用 x16PCIe3.0 链接和Nvidia 1080具体数字如下
- 48GB/s(CPU 到内存)
- ~16GB/s(PCIe 带宽(CPU 到 GPU))
- 320GB/s(GPU带宽)
因此,虽然 CPU 与其本地内存具有相对较好的带宽,并且 GPU 与其内存具有大量链接,但看起来这两个设备之间的链接是有限的。
对于游戏来说这并不是什么问题,游戏只需用纹理和场景数据加载 GPU,之后带宽要求相对较小。
对于 GPGPU 任务,CPU 和 GPU 之间的有限带宽链接是否存在问题完全取决于您的数据。
答案是,这取决于您使用 GPU 执行的操作。
答案2
有两种类型的视频卡,根据其内存使用情况而有所区别。
融合的
集成 GPU 不使用自己的 RAM,而是利用系统的内存。坦率地说,它的主要优点是价格便宜。集成显卡属于低端产品,因此在玩 3D 游戏时可能需要调低图形设置。
投入的
专用或分立 GPU 拥有独立的视频内存源,不会影响系统使用的 RAM。该内存与计算机的系统内存完全分开。专用卡适用于严肃游戏或专业图形设计师。
结论
对于集成 GPU,只有一个内存,因此不需要复制。对于专用 GPU,两个内存之间没有连接,因此带宽不需要匹配,并且仍然没有复制。