答案1
来自一些 AMD 的介绍:
每个 SIMD 单元包含 16 个流核心,每个流核心包含 5 个处理单元。因此,ATI Radeon HD 5870 中的每个计算单元都有 80 个 (16 × 5) 处理单元。
类似物CUDA 核心是流核心, 和SIMD 单元类似于 nVidia 的流式多处理器。
CUDA 核心和 Stream 核心之间的区别在于,CUDA 核心由一个处理器组成,但每次只能执行一项操作,而 Stream 核心有 5 个处理器,可以同时执行最多 4 个“简单”操作(如加法/乘法),但仅限于矢量类型(如int4
、float4
)。对于标量类型,这 5 个处理器中的 4 个会等待,而另一个会完成所有工作。
性能上的主要差异不是由于核心的数量,而是由于核心的制造方式。nVidia 的 GPU 更适合浮点运算(因此它们用于大多数科学应用),而 ATI 的 GPU 在整数和按位运算领域无与伦比,并用于加密。