高 SLAB 值

Question

此主机没有足够的内存用于分配。在调整应用程序和进行容量评估时，请增加内存以防止主机崩溃。

根据 atop 输出中的 free + cache，内存利用率约为 96%。Linux 虚拟内存系统绝对会考虑这种内存压力。因此进行分页也就不足为奇了。

您需要进一步说明此机器上的应用程序工作负载，并深入了解其内存分配。Linux 运行各种类型的工作负载，而 slab 分配器具有非常通用的存储桶。

如果您使用 cgroups（例如 systemd），请使用它们查看每个服务的消耗情况。例如，如果 chrony 正在运行（用于 NTP），/sys/fs/cgroup/memory/system.slice/chronyd.service/memory.kmem.slabinfo将包含其 slab 分配。使用 systemd-cgtop 命令重复上述操作，按内存查看排名靠前的 cgroups。

按使用量计算，第二大 slab 是 198,000 个 task_struct 对象。任务表示进程。上面的 277 代表您一次运行多少个任务？您的应用程序或脚本分叉的频率是多少？sighand_cache 听起来像信号处理程序，发送给任务的信号量是多少，它们的处理程序做什么？

使用 Linux perf、ftrace 或 bpf 等工具进行详细分析。请参阅这个问题是关于板坯分析的想法。

Answer 1

此主机没有足够的内存用于分配。在调整应用程序和进行容量评估时，请增加内存以防止主机崩溃。