为什么服务器 CPU 如此弱且昂贵？

Question 1

那么让我们逐行回顾一下您的观点；

因此，我们来看看具有良好单核性能的 CPU。一个例子是 AMD EPYC 73F3，它（根据 passmark）与 Ryzen 5950X 相当，但价格高出 10 倍，并且额定 TDP 超过 x2。

这是一个糟糕的比较——尝试在基于 5950X 的“服务器”中放置两个 CPU，或超过 128GB 的内存，或拥有超过 64MB 的 L3 缓存，或超过 16+4 个 PCIe 通道。

恐怕你不知道服务器是什么，至少在生产/专业环境中不知道。客机、游轮、油轮、公共汽车、火车等的设计目标是可靠、有弹性，能够以可预测的成本满足多年内的各种使用要求 - 喷气式战斗机、快艇、汽车等的速度更快，但设计用于单一、集中的用例，可靠性和成本不是问题。

在英特尔领域，单核性能方面确实没有什么产品可以与之媲美，因为大多数产品都比 8 年前的 Xeon E5-2660 v3 略快。英特尔的优势在于其服务器 CPU 不是 NUMA，因此内存处理更好，支持似乎更完善，因此甚至不确定这些综合基准与实际情况有何关系，在实际情况下，内存需要在非 NUMA 感知应用程序中的内核之间移动（除了 Oracle 服务器之外，真的有任何 NUMA 感知产品吗？）

首先，服务器环境中没有人关心单核性能，也许只有极少数人关心，但 99% 以上的人不关心。看来您认为时钟速度是衡量单核性能的唯一标准，而忽略了内存/QPI/UPI/IPC 性能提升的影响 - 不仅像 4210T（10c/20t、2.3-base/3.4-turbo）这样的低端产品会将 2660v3 碾压（顺便说一下，它们的标价仅为 555 美元），而且像 8732C（28c/56t、3.2-base/3.5-turbo）这样的 SKU 会让旧芯片显得很愚蠢 - 以及它们所有的 40c/80t SKU。

当然，英特尔也做 NUMA，你可能指的是插槽上 NUMA，这是一个不同的东西，92xx Xeons 甚至做到了这一点 - 例如看看 9282（56c/112t），它有与 Zen CPU 相同的内存问题。

您断言“Oracle Server”是支持 NUMA 的罕见情况，这种说法是错误的，而且毫无意义，因为重要的是基本操作系统或虚拟机管理程序支持 NUMA，而且即使是最近推出的任何产品，多年来都支持 NUMA。除非竞争非常激烈，否则任何现代 Linux/Windows 都会乐意将进程及其内存保持在 NUMA 域内“彼此接近”的状态，ESXi/KVM/Xen 的情况也是如此，这种情况持续的时间更长，大多数服务器应用程序根本不需要考虑 NUMA，因为一切都已为他们处理好了。

Xeon 工作站 CPU 似乎与 AMD 的客户级 CPU 相当，但仍然不如普通客户可用的英特尔 CPU 强大。Xeon 工作站的唯一优势是它们支持 ECC，这似乎是这个空间仍然存在的唯一原因，因为您可以以一半的价格获得更好的客户 CPU，但没有 ECC 选项并且 RAM 有限。

较新的 Threadripper 和 Ryzen CPU 和芯片组支持 ECC，因此您在这里的观点毫无意义。

我还注意到 EPYC 存在一些问题，但 Ryzen 运行良好。所以这可能是一个引导性问题，但现在人们都在使用什么，也许我错过了什么，但如果你不想投入大量资金，那么在功耗、可靠性和性能方面获得与一些超便宜的 ryzen 设置相当的服务器似乎是不可能的，而你能做的最好的事情就是最终获得与消费级 2YO Ryzen 的单核性能。

哪些问题，能具体说一下吗？

再次说明您缺乏生产经验。本网站专门面向专业系统管理员/系统设计师，当您加入时我们会明确说明这一点。在服务器方面，我们的首要任务是维护我们拥有的数据，并为我们的基础设施所服务的数十/数百/数千个应用程序和用户提供服务。是的，我们关心电源使用、热量管理和整体服务器性能，但这些是可靠性、弹性、监控能力、故障预警和核心/线程/内存/PCIe 通道容量的次要问题 - 坦率地说，生产级 CPU 以外的任何东西都会在多个（如果不是全部）这些标准上失败。如果您觉得无聊，请谷歌搜索“RRAS”，看看这是否有助于您理解。

服务器领域的创新是否已经停滞？

不，完全不是，但它本质上永远不会与消费级部件处于相同的前沿，仅仅是因为我们需要可靠性——为什么我们要冒险运行具有几个稍快核心的 CPU 的服务器，但却失去我上面列出的所有我们需要的功能。

我上面的类比是关键——大量的人与其他人一起乘坐客机，因为它比乘坐战斗机到处飞行更便宜、更可靠，集装箱运输也是一样——你可以把一个集装箱放在一艘更快的快艇上，但数量加起来并不划算，很多其他完成事情的方式也是如此——处理更多的负载，更可靠、更便宜，采用更大、更精心设计的解决方案，而不是独特的定制解决方案。

打个比方，你走进机场的飞行员休息室，对所有波音和空客飞机大肆破坏，因为它们无法像塞斯纳那样轻松地翻滚。我们不是傻瓜，几乎每个经常来这里的人都有十年或更长时间（就我而言是 32 年）在非常大的基础设施上成功完成这项工作的经验，我们是专业人士，知道如何研究我们的工作并向同一领域的其他人学习（这实际上是这个网站的重点）。

你真的认为你的这篇文章是开创性的、天才级的工作，却被包括每个服务器和 CPU 制造商在内的数十万人忽视了——或者也许你只是需要了解更多？

Answer