Xeon E5 V3 - 2S 与 4S CPU - L3 缓存大小对性能的影响

Xeon E5 V3 - 2S 与 4S CPU - L3 缓存大小对性能的影响

我曾尝试搜索来回答这个问题,但发现很难获得具体信息,所以我想在这里问一下。抱歉标题太复杂了,但我的问题的本质是:在 Xeon E5 V3 系列 CPU 中,4S SKU 通常比 1S/2S SKU 具有更多的 L3 缓存;在单/双 CPU 配置中使用 4S SKU 时,这是否会带来实质性好处?

例如,考虑以下 2 个大致相似的芯片:E5-2620 v3 和 E5-4655 v3。它们都是 6 核/12 线程,都具有 3.2GHz 最大睿频时钟、相同的 L1 缓存(6x32 KB 8 路组相联指令/数据)、相同的 L2 缓存(6x256 KB 8 路组相联),但 E5-4655 v3 具有更高的基本时钟(2.9GHz vs 2.4GHz)和两倍的 L3 缓存(30 MB 20 路组相联共享缓存 vs 15 MB 20 路组相联共享缓存)。除了基本时钟差异外,在不同的工作负载(包括 Windows/Linux/FreeBSD 虚拟化、视频转码、数据库、存档压缩/提取等)中,由于 L3 缓存差异,在单/双 CPU 配置中看到这些 CPU 之间的差异是否合理?

我之所以问这个问题,是因为我现在有一台配备两个 E5-4655 v3 CPU 的戴尔 R730 服务器,而且我正考虑在不久的将来将 CPU 升级为单个 CPU(我并不真正需要第二个 CPU 提供的 PCIe 通道或额外内存容量,而且我想降低 2S 系统固有的功耗和潜在的性能损失)。二手 2S CPU 的价格通常比具有类似规格(核心/线程数、基本/加速时钟)的 4S CPU 的价格低很多,但我想知道将 L3 缓存减半会产生什么影响。请记住,如果我确实将 2 个 CPU 合并为 1 个,我不会购买上面提到的 E5-2620 v3(这只是为了说明目的);我会得到一个 >= 12 核的部件(尚未决定)。

我知道这个问题可能很难给出具体的答案,但如果有任何意见或相关基准数据,我将不胜感激。谢谢。

答案1

我知道这个问题可能不易于给出具体的答案,但如果有任何意见或相关的基准数据,我将不胜感激。

视情况而定,特别是因为你描述的工作负载多种多样。除非你测试你的工作负载,否则无法知道具体细节。基准测试可以定义某项事物的相对性能,但性能比这更复杂。

总体而言,当然,微架构越新、内核越多、时钟频率越高、缓存越多越好。但你还面临着功耗和成本等其他限制。

您提到的 Haswell 现在已经是好几代了。通常,这么老的处理器不值得这么耗电,而且会让人担心还能支持多久。如果您正在寻找二手或打折产品,可以尝试落后一代的先进处理器。

只要英特尔保持高度细分的产品线和高级功能,仅使用一个插槽和缓存即可实现四插槽系统似乎值得怀疑。这不是对 CPU 经济最不合理的激励,可能有意义。但它相当扭曲,只是因为更多的缓存看起来很诱人,需要一些数据来支持这样的决定。

还请考虑您是否愿意评估其他供应商。AMD EPYC 有一个简单的单插槽故事。例如,16 核 EPYC 7302P 有 128 MB L3,与 2 插槽 EPYC 7302 相同。不是您要求的二手 Xeon,但它可能提供价格竞争。AMD 肯定想销售单插槽系统。

答案2

这个问题的前提是 Xeon E5 4xxx 的 L3 缓存总是比 Xeon E5 2xxx 多,但这种假设并不普遍适用。例如,至强 2690v3:尽管是 2S 处理器,但它拥有 30 MB L3 缓存。

也就是说,将基于 Broadwell 的 CPU 上的 L3 缓存减半的影响将完全取决于应用程序对处理器施加的工作负载:转码或其他 FPU 繁重任务几乎不受影响,而虚拟化和数据库可能会出现 5-15% 的命中率(在相同的时钟/核心下)。

但是,4S 处理器通常每个核心具有更多 L3 缓存的主要原因是它们使用更复杂的 NUMA 布局,其中添加的缓存意味着访问主内存的延迟更低。此外,4S 系统可以使用 LLC(在本例中为 L3)的很大一部分来进行目录/监听/一致性,“浪费”的缓存比 2S 系统更多(但这在很大程度上取决于 CPU 和系统架构)。

对于将来使用旧部件进行更新,只需购买能为您提供最佳性价比的产品即可。如果购买大型 L3 CPU 价格昂贵,则只需避免使用(也许可以投资购买更多时钟/内核)。

相关内容