2 x Xeon Scalable 6148 上插槽之间的时钟速度不同的原因是什么?

2 x Xeon Scalable 6148 上插槽之间的时钟速度不同的原因是什么?

我有双服务器至强可扩展 6148运行 HPC 应用程序的 CPU。

  • 基本时钟:2.4GHz
  • 全核睿频:3.1 GHz

一些处理线程扩展性不佳,并且对 CPU 时钟敏感。我尝试设置亲和性并在运行关键线程的核心上禁用 HT。但在某些时候,我注意到两个插槽之间的性能差异超过 10%。经过一些测试,我发现两个插槽在负载下以不同的时钟速度运行。以下是输出片段turbostat

Package Core    CPU     Avg_MHz Busy%   Bzy_MHz TSC_MHz IRQ     SMI     C1      C1E     C6      C1%     C1E%    C6%     CPU%c1  CPU%c6  CoreTmp PkgTmp  Pkg%pc2 PkgWatt RAMWatt PKG_%   RAM_%
-       -       -       1468    51.37   2864    1596    233634  0       1186    5607    24389   0.04    0.80    47.53   48.63   0.00    73      73      0.00    299.11  102.75  0.00    0.00
0       0       0       2738    99.46   2759    1596    5059    0       0       0       0       0.00    0.00    0.00    0.54    0.00    68      70      0.00    149.54  55.11   0.00    0.00
0       0       40      2738    99.46   2759    1596    5059    0       0       0       0       0.00    0.00    0.00    0.54
0       1       1       2738    99.48   2759    1596    5057    0       0       0       0       0.00    0.00    0.00    0.52    0.00    67
0       1       41      90      3.27    2755    1596    4889    0       153     776     4845    0.30    4.56    91.92   96.73
0       2       2       2738    99.46   2759    1596    5059    0       0       0       0       0.00    0.00    0.00    0.54    0.00    67
0       2       42      63      2.30    2739    1596    221     0       3       97      149     0.01    1.29    96.38   97.70
0       3       3       2737    99.45   2759    1596    5059    0       0       0       0       0.00    0.00    0.00    0.55    0.00    69

1       0       20      2954    99.54   2975    1596    5060    0       0       0       0       0.00    0.00    0.00    0.46    0.00    69      73      0.00    149.57  47.64   0.00    0.00
1       0       60      14      0.49    2972    1596    705     0       2       120     745     0.00    1.00    98.51   99.51
1       1       21      2953    99.53   2975    1596    5059    0       0       0       0       0.00    0.00    0.00    0.47    0.00    70
1       1       61      13      0.45    2981    1596    535     0       6       25      539     0.03    0.38    99.14   99.55
1       2       22      2954    99.55   2975    1596    5059    0       0       0       0       0.00    0.00    0.00    0.45    0.00    72
1       2       62      11      0.36    2978    1596    572     0       1       46      616     0.00    0.60    99.03   99.64

差异为 200-300 MHz。最初我怀疑应用程序负载不均匀,但上面显示的只是使用多个yes > /dev/null & Thermals 实例的虚拟负载,似乎对两个 CPU 都没有问题。在看似平衡的负载中,速度差异如此之大的原因是什么?

相关内容