为什么我们的 CPU 所有核心的速度都相同，而不是不同速度的组合？

Question 1

这就是所谓的异构多处理（氢化可的松) 并被移动设备广泛采用。在基于 ARM 的设备中，大小，处理器包含具有不同性能和功率分布的内核，例如，一些内核运行速度快但耗电量大（更快的架构和/或更高的时钟），而另一些内核节能但速度慢（更慢的架构和/或更低的时钟）。这很有用，因为一旦超过某个点，随着性能的提高，功耗往往会不成比例地增加。这里的想法是在需要时获得性能，在不需要时延长电池寿命。

在桌面平台上，功耗问题不大，因此这并不是真正必要的。大多数应用程序都希望每个核心具有相似的性能特征，而 HMP 系统的调度过程比传统 SMP 系统的调度过程复杂得多。（Windows 10 在技术上支持 HMP，但它主要用于使用 ARM big.LITTLE 的移动设备。）

此外，当今大多数台式机和笔记本电脑处理器不是由于热或电气限制，即使是短时间的突发，某些核心也需要比其他核心运行得更快。我们在制造单个核心的速度上基本上遇到了瓶颈，因此用较慢的核心替换一些核心不会让剩余的核心运行得更快。

虽然有些台式机处理器有一个或两个内核能够比其他内核运行得更快，但这种能力目前仅限于某些非常高端的英特尔处理器（如 Turbo Boost Max 技术 3.0），并且只会对运行速度更快的内核带来性能上的轻微提升。

虽然可以设计一个传统的 x86 处理器，既有大型、快速的内核，也有小型、较慢的内核，以针对高线程工作负载进行优化，但这会增加处理器设计的复杂性，应用程序不太可能正确支持它。

假设有一个处理器，有两个快速卡比湖（第七代酷睿）核心和八个慢速戈德蒙特（Atom）核心。总共有 10 个核心，针对这种处理器优化的重线程工作负载可能会比普通的四核处理器性能和效率更高卡比湖处理器。然而，不同类型的内核具有截然不同的性能水平，慢速内核甚至不支持快速内核支持的一些指令，例如AVX（ARM 通过要求大核和小核都支持相同的指令来避免这个问题。）

同样，大多数基于 Windows 的多线程应用程序都假设每个内核具有相同或几乎相同的性能水平，并且可以执行相同的指令，因此这种不对称可能会导致性能不理想，甚至在使用慢速内核不支持的指令时崩溃。虽然英特尔可以修改慢速内核以添加高级指令支持，以便所有内核都可以执行所有指令，但这无法解决异构处理器的软件支持问题。

另一种应用程序设计方法更接近于您在问题中想到的方法，即使用 GPU 来加速应用程序的高度并行部分。这可以使用以下 API 来实现OpenCL和通用计算架构至于单芯片解决方案，AMD 在其 APU 中推广对 GPU 加速的硬件支持，将传统 CPU 和高性能集成 GPU 结合到同一芯片上，异构系统架构，尽管除了少数专门的应用之外，该技术尚未得到广泛的行业采用。

Answer