为什么 Geforce 卡的双精度性能比 Tesla 卡慢 4 倍?

为什么 Geforce 卡的双精度性能比 Tesla 卡慢 4 倍?

我在很多地方都看到过这个说法。摘自维基百科:

对于等效单精度输出,基于 Fermi 的 nVidia Geforce 卡的双精度性能比 Tesla 卡低四倍。

我听过一些关于“乘数”的模糊解释。这是否与等效 Geforce 芯片中的某些物理缺陷有关?

答案1

这是在硬件中实现双精度运算与将双精度运算作为四个单精度运算执行之间的区别。

例如,考虑将“16”乘以“43”。如果您有一个原生的两位数乘法器,那么只需一次运算即可完成。如果您只有一个一位数乘法器,那么您需要将 1 乘以 4、将 1 乘以 3、将 6 乘以 4 和将 6 乘以 3 才能完成此操作。如下所示:

   16
 X 43
 ----
   18 (6*3)
   3  (3*1)
  24  (4*6)
  4   (4*1)
-----
  688

请注意,你需要做4两位数乘法需要 2 次单数乘法,因此需要 4 倍的时间。因此,如果您没有双精度乘法器,而只有单精度乘法器,则进行双精度乘法需要 4 倍的时间。

相关内容