为什么 Geforce 卡的双精度性能比 Tesla 卡慢 4 倍？

Question

这是在硬件中实现双精度运算与将双精度运算作为四个单精度运算执行之间的区别。

例如，考虑将“16”乘以“43”。如果您有一个原生的两位数乘法器，那么只需一次运算即可完成。如果您只有一个一位数乘法器，那么您需要将 1 乘以 4、将 1 乘以 3、将 6 乘以 4 和将 6 乘以 3 才能完成此操作。如下所示：

   16
 X 43
 ----
   18 (6*3)
   3  (3*1)
  24  (4*6)
  4   (4*1)
-----
  688

请注意，你需要做4两位数乘法需要 2 次单数乘法，因此需要 4 倍的时间。因此，如果您没有双精度乘法器，而只有单精度乘法器，则进行双精度乘法需要 4 倍的时间。

Answer 1

这是在硬件中实现双精度运算与将双精度运算作为四个单精度运算执行之间的区别。

例如，考虑将“16”乘以“43”。如果您有一个原生的两位数乘法器，那么只需一次运算即可完成。如果您只有一个一位数乘法器，那么您需要将 1 乘以 4、将 1 乘以 3、将 6 乘以 4 和将 6 乘以 3 才能完成此操作。如下所示：

   16
 X 43
 ----
   18 (6*3)
   3  (3*1)
  24  (4*6)
  4   (4*1)
-----
  688

请注意，你需要做4两位数乘法需要 2 次单数乘法，因此需要 4 倍的时间。因此，如果您没有双精度乘法器，而只有单精度乘法器，则进行双精度乘法需要 4 倍的时间。

相关内容