为什么服务器 CPU 如此弱且昂贵?

为什么服务器 CPU 如此弱且昂贵?

因此,我们来看看具有良好单核性能的 CPU。一个例子是 AMD EPYC 73F3,它(根据 passmark)与 Ryzen 5950X 相当,但价格高出 10 倍,并且额定 TDP 超过 x2。

在英特尔领域,单核性能方面确实没有什么产品可以与之媲美,因为大多数产品都比 8 年前的 Xeon E5-2660 v3 略快。英特尔的优势在于其服务器 CPU 不是 NUMA,因此内存处理更好,支持似乎更完善,因此甚至不确定这些综合基准与实际情况有何关系,在实际情况下,内存需要在非 NUMA 感知应用程序中的内核之间移动(除了 Oracle 服务器之外,真的有任何 NUMA 感知的东西吗?)

Xeon 工作站 CPU 似乎与 AMD 的客户级 CPU 相当,但仍然不如普通客户可用的英特尔 CPU 强大。Xeon 工作站的唯一优势是它们支持 ECC,这似乎是这个空间仍然存在的唯一原因,因为您可以以一半的价格获得更好的客户 CPU,但没有 ECC 选项并且 RAM 有限。

我还注意到 EPYC 存在一些问题,但 Ryzen 运行良好。所以这可能是一个引导性问题,但现在人们都在使用什么,也许我错过了什么,但如果你不想投入大量资金,那么在功耗、可靠性和性能方面获得与一些超便宜的 ryzen 设置相当的服务器似乎是不可能的,而你能做的最好的事情就是最终获得与消费级 2YO Ryzen 的单核性能。

服务器领域的创新是否已经停滞?

答案1

那么让我们逐行回顾一下您的观点;

因此,我们来看看具有良好单核性能的 CPU。一个例子是 AMD EPYC 73F3,它(根据 passmark)与 Ryzen 5950X 相当,但价格高出 10 倍,并且额定 TDP 超过 x2。

这是一个糟糕的比较——尝试在基于 5950X 的“服务器”中放置两个 CPU,或超过 128GB 的​​内存,或拥有超过 64MB 的 L3 缓存,或超过 16+4 个 PCIe 通道。

恐怕你不知道服务器是什么,至少在生产/专业环境中不知道。客机、游轮、油轮、公共汽车、火车等的设计目标是可靠、有弹性,能够以可预测的成本满足多年内的各种使用要求 - 喷气式战斗机、快艇、汽车等的速度更快,但设计用于单一、集中的用例,可靠性和成本不是问题。

在英特尔领域,单核性能方面确实没有什么产品可以与之媲美,因为大多数产品都比 8 年前的 Xeon E5-2660 v3 略快。英特尔的优势在于其服务器 CPU 不是 NUMA,因此内存处理更好,支持似乎更完善,因此甚至不确定这些综合基准与实际情况有何关系,在实际情况下,内存需要在非 NUMA 感知应用程序中的内核之间移动(除了 Oracle 服务器之外,真的有任何 NUMA 感知产品吗?)

首先,服务器环境中没有人关心单核性能,也许只有极少数人关心,但 99% 以上的人不关心。看来您认为时钟速度是衡量单核性能的唯一标准,而忽略了内存/QPI/UPI/IPC 性能提升的影响 - 不仅像 4210T(10c/20t、2.3-base/3.4-turbo)这样的低端产品会将 2660v3 碾压(顺便说一下,它们的标价仅为 555 美元),而且像 8732C(28c/56t、3.2-base/3.5-turbo)这样的 SKU 会让旧芯片显得很愚蠢 - 以及它们所有的 40c/80t SKU。

当然,英特尔也做 NUMA,你可能指的是插槽上 NUMA,这是一个不同的东西,92xx Xeons 甚至做到了这一点 - 例如看看 9282(56c/112t),它有与 Zen CPU 相同的内存问题。

您断言“Oracle Server”是支持 NUMA 的罕见情况,这种说法是错误的,而且毫无意义,因为重要的是基本操作系统或虚拟机管理程序支持 NUMA,而且即使是最近推出的任何产品,多年来都支持 NUMA。除非竞争非常激烈,否则任何现代 Linux/Windows 都会乐意将进程及其内存保持在 NUMA 域内“彼此接近”的状态,ESXi/KVM/Xen 的情况也是如此,这种情况持续的时间更长,大多数服务器应用程序根本不需要考虑 NUMA,因为一切都已为他们处理好了。

Xeon 工作站 CPU 似乎与 AMD 的客户级 CPU 相当,但仍然不如普通客户可用的英特尔 CPU 强大。Xeon 工作站的唯一优势是它们支持 ECC,这似乎是这个空间仍然存在的唯一原因,因为您可以以一半的价格获得更好的客户 CPU,但没有 ECC 选项并且 RAM 有限。

较新的 Threadripper 和 Ryzen CPU 和芯片组支持 ECC,因此您在这里的观点毫无意义。

我还注意到 EPYC 存在一些问题,但 Ryzen 运行良好。所以这可能是一个引导性问题,但现在人们都在使用什么,也许我错过了什么,但如果你不想投入大量资金,那么在功耗、可靠性和性能方面获得与一些超便宜的 ryzen 设置相当的服务器似乎是不可能的,而你能做的最好的事情就是最终获得与消费级 2YO Ryzen 的单核性能。

哪些问题,能具体说一下吗?

再次说明您缺乏生产经验。本网站专门面向专业系统管理员/系统设计师,当您加入时我们会明确说明这一点。在服务器方面,我们的首要任务是维护我们拥有的数据,并为我们的基础设施所服务的数十/数百/数千个应用程序和用户提供服务。是的,我们关心电源使用、热量管理和整体服务器性能,但这些是可靠性、弹性、监控能力、故障预警和核心/线程/内存/PCIe 通道容量的次要问题 - 坦率地说,生产级 CPU 以外的任何东西都会在多个(如果不是全部)这些标准上失败。如果您觉得无聊,请谷歌搜索“RRAS”,看看这是否有助于您理解。

服务器领域的创新是否已经停滞?

不,完全不是,但它本质上永远不会与消费级部件处于相同的前沿,仅仅是因为我们需要可靠性——为什么我们要冒险运行具有几个稍快核心的 CPU 的服务器,但却失去我上面列出的所有我们需要的功能。

我上面的类比是关键——大量的人与其他人一起乘坐客机,因为它比乘坐战斗机到处飞行更便宜、更可靠,集装箱运输也是一样——你可以把一个集装箱放在一艘更快的快艇上,但数量加起来并不划算,很多其他完成事情的方式也是如此——处理更多的负载,更可靠、更便宜,采用更大、更精心设计的解决方案,而不是独特的定制解决方案。

打个比方,你走进机场的飞行员休息室,对所有波音和空客飞机大肆破坏,因为它们无法像塞斯纳那样轻松地翻滚。我们不是傻瓜,几乎每个经常来这里的人都有十年或更长时间(就我而言是 32 年)在非常大的基础设施上成功完成这项工作的经验,我们是专业人士,知道如何研究我们的工作并向同一领域的其他人学习(这实际上是这个网站的重点)。

你真的认为你的这篇文章是开创性的、天才级的工作,却被包括每个服务器和 CPU 制造商在内的数十万人忽视了——或者也许你只是需要了解更多?

答案2

服务器 CPU 通常具有更适合典型服务器工作负载和企业部署的指令和功能:

  • 针对并发性进行了优化(而不是单线程应用程序性能服务器工作负载通常通过使用更多内核来扩展,而不是在单个内核上以最高时钟频率运行)

  • 它们可以安装低层 CPU 冷却器,以适应 1U 服务器机箱

  • 虚拟化支持

  • 更多 CPU 缓存

  • 附加的CPU指令集

  • 没有内置图形

  • 服务器 CPU 与主板上的相关芯片组协同工作,您可能会遇到:

    • 多处理器支持
    • 更多存储库和更多支持的内存
    • ECC 内存
    • 更多 PCI 通道和扩展槽
    • 10 GbE(或更快)有线网络
    • 没有台式机/笔记本电脑功能:
      • 没有无线网络
      • 没有蓝牙
      • 没有 HDMI/显示端口/多个视频端口
    • 带外管理
    • SAS 端口而非 SATA 端口
    • 支持多种 NVME
  • 和别的

通常,只有当您正在寻找这些功能并且有特定的工作负载时,在台式机中使用服务器 CPU 才有意义,而这些工作负载更适合使用具有服务器规格的工作站。一般来说,服务器 CPU 并不能制造出“更好”的台式机

相关内容