计算 GPU 的 Double FLOPS

计算 GPU 的 Double FLOPS

我正在使用 OpenCL 进行一些 GPU 计算,但计算显卡的 FLOPS 时遇到了困难。我使用的浮点 FLOPS 公式非常简单:

frequency * cores * (instructions/cycle)
where: instructions/cycle is 4 for CPU and 2 for GPU

问题是,我如何计算特定显卡的双精度理论峰值性能。我的显卡是 GeForce GTX 580。

——丹尼尔。

答案1

https://devtalk.nvidia.com/default/topic/495177/cuda-programming-and-performance/what-is-the-double-precision-flops-rating-of-the-gtx580-/

[1.544 GHz] * [512 CUDA Cores] * [2 double precision floating point operations/8 clock cycles] = 198 GFLOPS.

尤其这是 seibert 的评论上面的线程深入讨论了 2/8 在等式中的位置细节。

相关内容