DL580 G7 的 CPU 性能较低(E7 4870)

DL580 G7 的 CPU 性能较低(E7 4870)

我有一台 DL580 G7,安装了四个 E7 4870 和 128GB 的​​ RAM(八个卡盒,每个卡盒有 2 个 8GB)。操作系统是 Ubuntu 18.04。pcie16 上有一个 TITAN X,安装了必备的 p410i,但没有其他外围设备。当我对这个系统进行基准测试时,我得到了它应该提供的性能的大约 50%。例如,这是一个参考基准DL580G7 配备稍弱的 CPU(E7 4850)以及其他类似的设置。

但是我的系统在同样的基准测试中只能达到一半的性能(我的 CPU 性能约为 980,多核性能约为 20,000)。这似乎不对。

基准测试显示所有 80 个核心和 128GB RAM,因此硬件被正确识别。

我已经查看了 HP 的低延迟调优清单并相应地更改了 BIOS。ILO3 中的电源设置全部为最高性能。

Ubuntu 在所有 80 个内核上都设置为“性能”调节器。
我注意到,即使我将系统置于高压力下(例如,在 CPU 使用率达到 100% 的情况下对所有 80 个内核进行数字运算数小时),CPU 的热量也几乎没有变化(它们保持在 40 度),风扇根本不转动(它们保持在 40%)。ILO3 中显示的总功耗高达 650 瓦,但我预计在压力条件下会更接近 1KW。我对此有点困惑。

我已经尝试了不同的 BIOS 版本。原始 BIOS 是 2013 年 7 月 1 日,这也导致其他用户出现性能问题(互联网上也有此类报告)。因此我将其降级为 2012 年 12 月 3 日,但问题仍然存在。

此外,当我将这台机器的性能与我之前的机器(有一台 i5 4460)进行比较时,我注意到我的应用程序的单核性能下降了四倍(在非 IO 密集型操作上,例如添加大量向量),这与基准测试的结果一致,但单核性能下降两倍是我所预料的。我只关心 CPU 性能。据我所知,RAID 运行良好,IO 符合预期(但也可能因 CPU 性能下降而受到影响)。

当我在压力期间执行操作时cat /proc/cpuinfo,我发现 CPU 以 2,2Ghz 运行。

到目前为止,我还没有测试过不同的操作系统。一旦有机会重启机器,我就会这样做。

答案1

检查 BIOS 中的电源管理设置。确保它们设置为 OS 控制。默认的 HPE BIOS 电源管理设置会导致电源使用率高但性能差。

通常,此设置可在以下位置找到:电源管理 > HP 电源调节器 > OS 控制模式。

HPE BIOS 屏幕截图

答案2

我很怀念在 Server Fault 上看到这样的问题......但同时,这不是一个常见的请求。

服务器是旧架构。你做出的一些假设可能会让你走上错误的道路。

我的建议:

您不应该只依赖 HP 低延迟调优指南中推荐的功能。该指南适用于算法交易等专门的应用程序,其目标是确定性和可预测的资源利用率。实时性能特征和低延迟并不一定意味着快点

我会查看 CPU 的功能并从那里开始工作......

英特尔至强 E7-4870
于 2011 年推出,于 2015 年某个时候终止使用。

这是一款支持 Turbo Boost 的 CPU。最大睿频频率为 2.80GHz。当您使用“HP 静态高性能模式”等固定设置时,它实际上禁用了 Turbo Boost。在这种情况下,您最好使用您所使用的 Linux 下的 OS 控制模式。(我也推荐 VMware 系统使用此模式!)

在您的操作系统中,看看是否可以安装powertopturbostat

在计算运行期间监控其中一个或两个。

我很惊讶你竟然在查看 CPU 温度或功耗。我从未用它们来衡量服务器的运行情况。你使用 Ubuntu(通常不支持 HP ProLiant 硬件)缺少的是操作系统与 ILO 管理处理器之间的交互。这是 ProLiant 设备的增值之一。对于裸机系统,我尝试使用类似 RHEL/CentOS 的操作系统,因为它具有硬件监控和健康集成功能。

另外,请返回到最新的 BIOS 版本。很少有理由降级 HP 系统固件。还请确保您的 ILO3 固件是最新的。

答案3

XEON E7-4870 CPU包含10个物理核心。(https://ark.intel.com/products/53579/Intel-Xeon-Processor-E7-4870-30M-Cache-2-40-GHz-6-40-GT-s-Intel-QPI-) 此服务器/CPU 配置仅包含 40 个内核,而不是所述的 80 个内核。您是否可能混淆了内核和线程?此外,此 CPU 仅在 4 个活动内核的情况下才能达到最高时钟频率 2.8 GHz。因此,总共有 16 个内核 @ 2.8 GHz,而 40 个内核 @ 2.4 GHz。

DL580 G7 的内存配置也需要考虑。此系统可实现的最高内存带宽(优化的半球模式https://support.hpe.com/hpsc/doc/public/display?docId=c02283239#N100AB) 需要 64 个四列 DIMM。

我知道我的回答有些迟了,但可能会对未来的搜索者有所帮助;而且我没有评论的名声。

答案4

一系列事情都出错了,我昨晚终于找到了解决方案!降级 ROM 和将电源调节器设置为操作系统控制的组合奏效了。** 最初,这台(二手)服务器安装了有故障的 BIOS 07/01/2013(参见 [https://blog.netnerds.net/2014/02/solved-degraded-performance-on-hp-dl580-g7-on-bios-v-7012013/]),这使得对 ROM 上的电源调节设置的任何更改都无效。** 尽管系统只提供了 50% 的性能,但“cat /proc/cpuinfo”返回的速度为每核 2,2ghz(略低于最大值 2,4,但远远低于 50%)。这个结果与 turbostat 等其他工具报告的结果一致。确实非常奇怪,这个事实让我更加困惑。 * 我试图在 Linux 启动时禁用 c 状态,但这并没有帮助(没有好转,也没有恶化)。 * 最后,我现在在单核上得到了 2100,在多核 geekbench 上得到了 36,000。在禁用超线程的情况下,这差不多。我想通过一些耐心的调整,应该可以超过多核 geekbench 的 40,000 大关,但就目前而言,我很满意。

真正让我恼火的是,所有 CPU 工具都报告核心速度至少为 2.2GHz,但我的系统却慢得令人难以忍受。我认为这一定是 07/01/2013-ROM 的奇怪错误。我同意将 ROM/ILO 固件升级到最新版本是最好的,但我还没有时间认真尝试。

相关内容