Intel PCM(性能计数器监视器)-LLC 命中率低

Intel PCM(性能计数器监视器)-LLC 命中率低

我正在英特尔至强 D-1520中央处理器

我试着跑英特尔 PCM获得 L3 缓存未命中和命中率。

L3MISS: L3 cache misses

L3HIT : L3 cache hit ratio (0.00-1.00)


Core (SKT) | EXEC | IPC  | FREQ  | AFREQ | L3MISS | L2MISS | L3HIT | L2HIT | L3MPI | L2MPI |  L3OCC |   LMB  |   RMB  | TEMP

   0    0     0.02   1.06   0.02    0.37     411 K    489 K    0.16    0.05    0.01    0.01      176       16        0     58
   1    0     0.05   0.38   0.13    0.60    3823 K   4508 K    0.15    0.16    0.04    0.04     4048       95        0     58
   2    0     0.03   1.01   0.03    0.40     524 K    601 K    0.13    0.09    0.01    0.01        0       20        0     58
   3    0     0.05   0.87   0.06    0.42    1758 K   2033 K    0.14    0.13    0.02    0.02     1776       63        0     58
   4    0     0.02   1.24   0.02    0.37     196 K    247 K    0.21    0.06    0.00    0.00       16       13        0     58
   5    0     0.09   0.88   0.10    0.66    2270 K   2565 K    0.11    0.12    0.01    0.01      128       99        0     58
   6    0     0.03   1.27   0.02    0.40     218 K    273 K    0.20    0.05    0.00    0.00       32       14        0     58
   7    0     0.03   1.43   0.02    0.40     221 K    279 K    0.21    0.04    0.00    0.00      160       16        0     58
---------------------------------------------------------------------------------------------------------------
 SKT    0     0.04   0.80   0.05    0.51    9425 K     10 M    0.14    0.13    0.01    0.02     6336      336        0     58
---------------------------------------------------------------------------------------------------------------
 TOTAL  *     0.04   0.80   0.05    0.51    9425 K     10 M    0.14    0.13    0.01    0.02     N/A     N/A     N/A      N/A

1.

L3 命中率总是很低吗?从上面显示的值来看,大多数这些值都低于 20%。这是正常的吗?

答案1

我是 Intel PCM 的新手,正在尝试测量 L3 未命中值。
我读到过一些文章(可能是 Intel 论坛,我猜)10%-15%由于多种原因,系统范围统计的原始值较低。相信您使用的是 Windows 操作系统。

如果是 Linux,请尝试在 make 文件中列出 perf 命令用法。在我针对 Linux 进行的测试中,L3 缓存值在正常情况下略高 [即我的 i7(第 7 代)笔记本电脑负载不重]。

除了 PCM,PCM-Core 还有助于查询计数器的具体值。例如,在 Windows 系统上,可以使用以下命令来了解MEM_LOAD_UOPS_RETIRED_L3_MISS./pcm-core.x 1.0 -e cpu/umask=0x20,event=0xD1。1.0 - 每秒的 Umask 和来自处理器(英特尔)数据表的事件值。(无法记住确切的文件名)。输出应类似于1. 第一个查询 = 事件 0。最多可查询 3 个事件。

相关内容