我正在英特尔至强 D-1520中央处理器
我试着跑英特尔 PCM获得 L3 缓存未命中和命中率。
L3MISS: L3 cache misses
L3HIT : L3 cache hit ratio (0.00-1.00)
Core (SKT) | EXEC | IPC | FREQ | AFREQ | L3MISS | L2MISS | L3HIT | L2HIT | L3MPI | L2MPI | L3OCC | LMB | RMB | TEMP
0 0 0.02 1.06 0.02 0.37 411 K 489 K 0.16 0.05 0.01 0.01 176 16 0 58
1 0 0.05 0.38 0.13 0.60 3823 K 4508 K 0.15 0.16 0.04 0.04 4048 95 0 58
2 0 0.03 1.01 0.03 0.40 524 K 601 K 0.13 0.09 0.01 0.01 0 20 0 58
3 0 0.05 0.87 0.06 0.42 1758 K 2033 K 0.14 0.13 0.02 0.02 1776 63 0 58
4 0 0.02 1.24 0.02 0.37 196 K 247 K 0.21 0.06 0.00 0.00 16 13 0 58
5 0 0.09 0.88 0.10 0.66 2270 K 2565 K 0.11 0.12 0.01 0.01 128 99 0 58
6 0 0.03 1.27 0.02 0.40 218 K 273 K 0.20 0.05 0.00 0.00 32 14 0 58
7 0 0.03 1.43 0.02 0.40 221 K 279 K 0.21 0.04 0.00 0.00 160 16 0 58
---------------------------------------------------------------------------------------------------------------
SKT 0 0.04 0.80 0.05 0.51 9425 K 10 M 0.14 0.13 0.01 0.02 6336 336 0 58
---------------------------------------------------------------------------------------------------------------
TOTAL * 0.04 0.80 0.05 0.51 9425 K 10 M 0.14 0.13 0.01 0.02 N/A N/A N/A N/A
1.
L3 命中率总是很低吗?从上面显示的值来看,大多数这些值都低于 20%。这是正常的吗?
答案1
我是 Intel PCM 的新手,正在尝试测量 L3 未命中值。
我读到过一些文章(可能是 Intel 论坛,我猜)10%-15%由于多种原因,系统范围统计的原始值较低。相信您使用的是 Windows 操作系统。
如果是 Linux,请尝试在 make 文件中列出 perf 命令用法。在我针对 Linux 进行的测试中,L3 缓存值在正常情况下略高 [即我的 i7(第 7 代)笔记本电脑负载不重]。
除了 PCM,PCM-Core 还有助于查询计数器的具体值。例如,在 Windows 系统上,可以使用以下命令来了解MEM_LOAD_UOPS_RETIRED_L3_MISS
值./pcm-core.x 1.0 -e cpu/umask=0x20,event=0xD1
。1.0 - 每秒的 Umask 和来自处理器(英特尔)数据表的事件值。(无法记住确切的文件名)。输出应类似于1. 第一个查询 = 事件 0。最多可查询 3 个事件。