在 Blender Cycles 预览(非渲染)中,GPU 比 CPU 快 20 倍,但渲染速度仅为 CPU 的两倍

在 Blender Cycles 预览(非渲染)中,GPU 比 CPU 快 20 倍,但渲染速度仅为 CPU 的两倍

在 Blender Cycles 预览(不渲染图像)中,我的 GPU 比 CPU 快 20 倍,但在渲染中仅快两倍。如前所述,GPU 和 CPU 速度是在预览模式下进行比较的,因此如果有任何东西会在实际渲染中拖慢速度,那么它对 CPU/GPU 的影响基本相同(我认为)。

500 美元 GPU!- GTX 1060 (6GB)、CPU - i7-6700

我尝试将瓷砖尺寸设为 256 x 256。

答案1

对于预览,计算可能采用所谓的“单精度”,而对于渲染,它使用更精确的“双精度”以获得更好的质量。

单精度计算允许它使用显卡上的单精度 CUDA 核心,而双精度计算则使用双精度核心。“消费者”卡中的单精度核心数量是后者的 32 倍:

在 GP104 上,SM 结合了 128 个单精度 ALU 和 4 个双精度 ALU,提供 32:1 的比例

(从维基百科

游戏玩家或“消费者”显卡倾向于放弃双精度核心而选择单精度核心,因为它们提供最大的“性价比”,并且非常适合大多数家庭游戏或图形任务。

诸如 Tesla 之类的工作站级卡更适合科学应用,并且具有完整的双精度功能单元。

维基百科

Pascal GPU 的理论双精度处理能力为 ... GP102 和 GP104 上的 1/32(单精度性能)。

104 是 GTX 1070,但我预计在基于 GP106 的 1060 卡上双精度计算的损失也类似。

另一方面,您的 CPU 可能没有同样的问题,并且单精度或双精度不会像显卡那样产生性能损失。

相关内容