AMD Epyc,偶尔表现糟糕

AMD Epyc,偶尔表现糟糕

我正在使用 2x AMD EPYC 7451 服务器,将扩展调节器设置为性能,但服务器在低负载时会出现问题。当负载较低时,所有内核基本上都会降级到 600-1000MHz,响应时间会飙升至正常值的 2-3 倍,而 CPU 负载甚至没有报告那么低,因为所有内核都在使用这些糟糕的时钟运行……

因此,我认为在负载较低时应该发生的是,内核进程调度程序可以将所有正在运行的线程放在一个 NUMA 节点上,并扩展这两个 CPU 核心的调速器最大值,这样 24 个核心将以 2.8GHz 的速度运行,其余核心可以以 600MHz 的速度闲置。或者至少可以让所有核心保持正常速度。

实际情况是,每个核心都设置为 600-1000,然后内核似乎在所有这 96 个慢速核心上循环线程,这实际上甚至有点可笑,因为很难想出更好的方法来浪费能源,在无限结构上产生不必要的负载,同时降低性能。甚至处理请求的速度比服务器高负载时慢 3 倍。

我不想因为它看起来像内核问题而忽略 AMD SPU。对于 Intel 来说,它也是这样工作的,但只有在使用节能调节器时才如此。切换到性能模式可以解决这个问题,我想这有点合乎逻辑。我不确定为什么这台服务器在设置为性能模式时,像廉价笔记本电脑一样由内核管理电池节能?有什么想法吗?使用 Fedora 27 ATM...

Low Load:
cat /proc/cpuinfo | grep MHz
cpu MHz         : 685.117
cpu MHz         : 685.877
cpu MHz         : 656.451
cpu MHz         : 651.857
cpu MHz         : 622.491
cpu MHz         : 677.199
cpu MHz         : 702.872
cpu MHz         : 677.941
...

High Load:
cat /proc/cpuinfo | grep MHz
cpu MHz         : 2848.291
cpu MHz         : 2896.881
cpu MHz         : 2893.726
cpu MHz         : 2895.113
cpu MHz         : 2467.476
cpu MHz         : 2498.073
cpu MHz         : 2492.711
cpu MHz         : 2488.875
cpu MHz         : 2496.855
cpu MHz         : 2485.083
...

答案1

删除 BIOS 中 cpu/C4 设置的省电功能以实现最大性能,它将强制 CPU 保持在最大设置。

我怀疑是主板问题。

答案2

抱歉,自己回答这个问题有点愚蠢,但在尝试找到解决方案后,一切都已更新到最新版本 (fedora 29)。然后所有调度程序都按预期工作。因此,powersave/ondemand 保持较低的 CPU 速度,性能不再下降到 600MHz,但即使在服务器未使用时也始终保持一切高于 2.8GHz,我认为这是意料之中的……

看来 FC27 对于这个 CPU 来说太旧了......

相关内容