我想知道为什么 nVidia 提供这种类型的显卡配置,在本例中是 > GT730。
我知道,bandwidth = Memory clock x Memory interface width
但是内存配置或 CUDA 核心呢?它们在哪里发挥作用?
- 我想知道为什么 64 位版本有 2GB 而不是 1GB?(而 128 位版本有 1GB)。
- 我想知道为什么 GDDR5 版本有 1GB 而不是 2GB?(而 DDR3 版本有 2GB)。
- 我想知道为什么 GDDR5 版本有 64 位而不是 128 位?(而 DDR3 版本有 128 位)。
另外我想知道 64 位 4GB 的性能是否与 128 位 2GB 卡相同?或者 64 位 2GB 版本的性能是否与 128 位 1GB 卡相同?
答案1
我想知道为什么 64 位版本有 2GB 而不是 1GB?>而 128 位版本有 1GB。
这几乎肯定是因为 GPU 有两个内存控制器。
您可以获得两个 64 位通道,每个通道可使用 1GB 内存,或者一个 128 位通道,每个通道可使用单个 1GB 内存区域。
我想知道为什么 GDDR5 版本有 1GB 而不是 2GB?>而 DDR3 版本有 2GB。
可能是因为 GDDR5 提供的额外带宽需要 GPU 内部进行一些多路复用,从而将其限制为一个内存通道。真正的原因只有 GPU 设计师和 Nvidia 自己才知道。
另外我想知道 64 位 4GB 的性能是否与 128 位 2GB 卡相同?或者 64 位 2GB 的性能是否与 128 位 1GB 卡相同?
不是。内存的“位数”会影响可用的有效内存带宽。请查看内存接口宽度正下方的图。
图形任务往往受内存限制,内存带宽越大通常意味着性能越好。即便如此,在某些任务中,带宽较低但内存较大的显卡的性能可能优于带宽较小但内存较高的显卡。
你正在比较几张(坦率地说)非常差的卡,我非常怀疑你会看到它们之间巨大的性能差异。
原因在于:产品差异化以及因为他们可以做到。
答案2
CUDA 核心是根据 GPU 中存在的多处理器数量以及 ALU 通道数量和 ALU 通道宽度来计算的。
对于我的 GeForce GT 730 (DDR3,64 位版本):
(2 multiprocessors * 192 64-bit ALU lanes) = 384 CUDA cores
内存带宽也是根据GPU上的多处理器数量计算的:
(2 multiprocessors * 800 MHz) = 1600 MHz effective
在此设备上,单精度浮点运算比双精度快 24 倍。这可能因总线宽度和多处理器数量而异,但我目前没有其他可比较的东西。