工作站和桌面GPU对于CUDA计算的性能有什么区别?

工作站和桌面GPU对于CUDA计算的性能有什么区别?

比较工作站和台式机 GPU 卡,不清楚两者之间到底有什么不同。我知道工作站卡更适合专业用途,而台式机卡更适合游戏,但这对 CUDA 计算意味着什么?我看到的帖子似乎专注于 CAD 和 3D 渲染。我对运行编写为在 CUDA 上运行的 c/c++ 代码感兴趣通用计算架构Linux 系统的核心。

比较两款价格相近的显卡,台式机显卡提供的 CUDA 核心是原来的两倍,内存增加了 50%。

  1. Quadro K4200 目前自豪于789美元
    • 1344 个 CUDA 核心
    • 4GB 256 位 GDDR5
  2. GeForce GTX 980 Ti 目前售价699美元
    • 2816 个 CUDA 核心
    • 6 GB 384 位 GDDR5

还有其他需要考虑的差异吗?

答案1

两张卡都有其优点和缺点:

GTX 的性能要好得多:
http://gpu.userbenchmark.com/Compare/Nvidia-Quadro-K4200-vs-Nvidia-GTX-980/2838vs2576

GTX 980 基于较新的第二代 Maxwell 架构,这意味着它更有可能支持比 Quadro K4200(尽管是最新 Quadro 产品线的一部分,但仍然基于第一代 Kepler 架构)更新的技术。

关于 Quadro:

所以我打算购买 Nvidia Quadro K4200,因为我听说它的驱动程序支持更好的视口性能。然而,我在各种论坛上看到很多用户说,他们并不欣赏它提供的视口性能提升,而且这种提升微不足道。他们属于“GTX 的规格比价格高得多”阵营。“GTX 团队”

然后我看到有人认为规格根本不重要,一切都“取决于驱动程序”。(“Team Quadro”)他们宣称 Quadro 的卓越驱动程序对 Max 工作流程产生了巨大影响,完全值得付出高昂的价格。他们还说,硬件方面也存在重要差异,不仅仅是优化的 Quadro/节流的 GTX 驱动程序。

“Team GTX” 随后反驳说,这曾经是事实,但 Quadro 和 GTX 近年来已经趋于一致。他们讲述了他们如何做得好。网上的许多基准测试和讨论要么已经过时(例如,Quadro 非开普勒系列的比较),要么只是比较没有交叉的游戏卡/工作站卡。我使用过头对头基准测试网站,这些网站显示 GTX 980 的优势很大。但同样,基准测试似乎针对的是游戏玩家。

更复杂的是 GTX 970/980 与 Titan 的比较。Titan 似乎没有提供什么优势来证明其价格合理。

来源

也可以看看:

目前,ADOBE 开发人员不支持 GTX 900 系列显卡获取 nvidia 驱动程序并将其认证为 ADOBE SIGNED GTX 900 DRIVERS,就像 Nvidia 与 Microsoft for Windows(WHQL-Windows 硬件质量实验室)所做的那样...目前,GTX 900 GPU 实际上是基于 CUDA API 工作的,而 GTX 980 的 GPU GM204 无需 Maxwell 改进即可工作,但它的反应与旧的 Fermi 或 Kepler 一样。

目前,HP Z840、Precision T7810、Celsius R940、Thinkstation P900 等所有产品都基于 Quadro 卡,因为为这些 GPU 签名的驱动程序具有所有媒体的 ISV 认证,包括此处以及用于 AE 和 PR 的 VIDEO 上的解码器和编码器。

选择具有大量 Gpixel/s 或 Gtexel/s 或大量内存带宽的 GPU 并不重要(好吧,它们很重要,但是......)...首先选择经过认证的 GPU,例如现在的低预算 Quadro 2000/4000/5000/6000 和 Quadro K 2000/2200/4000/4200/5000/5200 或经过 AE 和 PR 认证的特殊游戏 GPU、GTX 780、GTX Titan 和 GTX 780 Ti,然后查看规格。

来源

在类似的问题中有更详细的解释:

一般来说:

  1. 如果您需要大量内存,那么您需要 Tesla 或 Quadro。消费卡 ATM 最大内存为 1.5 Gb(GTX 480),而 Teslas 和 Quadros 最大内存为 6 Gb。

  2. GF10x 系列显卡的双精度 (FP64) 性能上限为单精度 (FP32) 性能的 1/8,而架构可以达到 1/2。这是另一个市场细分技巧,如今在硬件制造商中颇为流行。削弱 GeForce 系列是为了使 Tesla 系列在 HPC 中占据优势;GTX 480 实际上比 Tesla 20x0 更快 - 1.34TFlops vs 1.03 TFlops,177.4 Gb vs 144 Gb/秒(峰值)。

  3. Tesla 和 Quadro 经过了(应该)更彻底的测试,因此不太可能产生与游戏无关的错误,但当涉及到科学计算时,只需一个位翻转就可能破坏结果。NVIDIA 声称 Tesla 卡经过 QC-d 认证,可全天候使用。

最近的一篇论文(Haque 和 Pande,《软错误的硬数据:对 GPGPU 中真实错误率的大规模评估》)表明特斯拉确实不太容易出错。

  1. 我的经验是 GeForce 显卡往往不太可靠,尤其是在持续高负载的情况下。适当的冷却非常重要,同时避免使用超频显卡,包括工厂超频型号

来源

评论部分也有关于此问题的讨论这个帖子

使用 CUDA 进行通用 GPU 计算时,性能存在明显差异。虽然 GeForces 确实支持双精度算法,但它们的性能似乎被人为地限制在单精度性能的 1/8,而 Quadros 的性能只有单精度性能的 1/2,这是意料之中的。免责声明:这是二手知识,我自己不做 CUDA。另一方面,在 OpenGL 中,Quadros 和 GeForces 都只使用单精度算法。这是基于对 CAVE 的观察,其中运行渲染节点的 Quadros 在处理大范围模型数据时显示出与常规 GeForces 完全相同的舍入问题。幸运的是,有现成的解决方法。

stvn66 找到的另一个有用的链接将进行总结:
https://www.pugetsystems.com/labs/articles/GTX-980-Ti-Linux-CUDA-performance-vs-Titan-X-and-GTX-980-659/

相关内容