我正在使用 OpenCL 进行一些 GPU 计算,但计算显卡的 FLOPS 时遇到了困难。我使用的浮点 FLOPS 公式非常简单:
frequency * cores * (instructions/cycle)
where: instructions/cycle is 4 for CPU and 2 for GPU
问题是,我如何计算特定显卡的双精度理论峰值性能。我的显卡是 GeForce GTX 580。
——丹尼尔。
答案1
[1.544 GHz] * [512 CUDA Cores] * [2 double precision floating point operations/8 clock cycles] = 198 GFLOPS.
尤其这是 seibert 的评论上面的线程深入讨论了 2/8 在等式中的位置细节。