超标量和并行之间的主要区别

Question 1

超标量是指 CPU 或单核的架构的术语。

要执行一条指令，CPU 必须执行多个步骤，每个步骤由 CPU 的特定专用部分或“执行单元”处理。非超标量 CPU 从步骤 0 开始到步骤 X（X 可能因指令类型而异），并在开始下一条指令之前完成所有步骤。

例如，超标量 CPU 会尝试在前一条指令完成所有步骤之前，在步骤 0 处将新指令放入“流水线”。因此，由于 CPU 的执行单元始终在工作，因此 CPU 的利用率更高、速度更快（也更复杂）。

如果工作负载可以划分为多个单元，以便多个单元可以有效地处理该工作负载，则该工作负载可实现并行性。超标量架构尝试在单个核心/CPU 中并行执行单个指令流。

并行处理在概念上类似，但我们不再讨论 CPU 的指令流，而是讨论需要处理的某些（可能很大的）数据集。如何将工作负载分配到 X 个 CPU 或通过网络连接的独立节点，运行相同或不同的程序，以便最有效地处理工作负载？需要什么来确保 CPU 或系统不会相互干扰并破坏数据？这就是并行处理提出的问题。

Answer

超标量是指 CPU 或单核的架构的术语。

要执行一条指令，CPU 必须执行多个步骤，每个步骤由 CPU 的特定专用部分或“执行单元”处理。非超标量 CPU 从步骤 0 开始到步骤 X（X 可能因指令类型而异），并在开始下一条指令之前完成所有步骤。

例如，超标量 CPU 会尝试在前一条指令完成所有步骤之前，在步骤 0 处将新指令放入“流水线”。因此，由于 CPU 的执行单元始终在工作，因此 CPU 的利用率更高、速度更快（也更复杂）。

如果工作负载可以划分为多个单元，以便多个单元可以有效地处理该工作负载，则该工作负载可实现并行性。超标量架构尝试在单个核心/CPU 中并行执行单个指令流。

并行处理在概念上类似，但我们不再讨论 CPU 的指令流，而是讨论需要处理的某些（可能很大的）数据集。如何将工作负载分配到 X 个 CPU 或通过网络连接的独立节点，运行相同或不同的程序，以便最有效地处理工作负载？需要什么来确保 CPU 或系统不会相互干扰并破坏数据？这就是并行处理提出的问题。

Question 2

超标量架构只是众多并行技术中的一种。维基百科上有关超标量处理器的页面解释得很好。

超标量处理器可以并行启动 2 条（或更多）指令，这意味着它有多个物理执行单元。这种并行性完全由处理器级别的硬件管理：处理器获取指令并自行决定哪些指令可以同时启动（可能无序启动）。编译器不必生成特定的二进制代码。

这与多核/多线程并行不同，后者在软件层面进行管理：编译器必须创建多个执行线程，这些线程可能在不同内核/不同 CPU 上执行。相比之下，超标量并行在内核内部运行，但这并不是唯一的：CPU 可以是多核的，每个内核都具有超标量架构。

正如另一个答案中所述，流水线也是一种完全由硬件级别管理的并行性：一次只能启动一条指令，但下一条指令可以在前一条指令完成之前启动。

许多处理器还具有矢量功能，即 SIMD 并行性（单指令、多数据）：处理器具有矢量寄存器，可以在其中加载多个变量（通常为 4、8……），而不是通常的寄存器中的一个变量，并且矢量指令可以同时对寄存器的所有变量应用相同的操作（加法、乘法……）。在这里，编译器必须生成明确包含这些指令的二进制文件。

Answer

超标量架构只是众多并行技术中的一种。维基百科上有关超标量处理器的页面解释得很好。

超标量处理器可以并行启动 2 条（或更多）指令，这意味着它有多个物理执行单元。这种并行性完全由处理器级别的硬件管理：处理器获取指令并自行决定哪些指令可以同时启动（可能无序启动）。编译器不必生成特定的二进制代码。

这与多核/多线程并行不同，后者在软件层面进行管理：编译器必须创建多个执行线程，这些线程可能在不同内核/不同 CPU 上执行。相比之下，超标量并行在内核内部运行，但这并不是唯一的：CPU 可以是多核的，每个内核都具有超标量架构。

正如另一个答案中所述，流水线也是一种完全由硬件级别管理的并行性：一次只能启动一条指令，但下一条指令可以在前一条指令完成之前启动。

许多处理器还具有矢量功能，即 SIMD 并行性（单指令、多数据）：处理器具有矢量寄存器，可以在其中加载多个变量（通常为 4、8……），而不是通常的寄存器中的一个变量，并且矢量指令可以同时对寄存器的所有变量应用相同的操作（加法、乘法……）。在这里，编译器必须生成明确包含这些指令的二进制文件。

相关内容