分析单个 CPU 的活动而不是总 CPU 的活动总和有什么用?

分析单个 CPU 的活动而不是总 CPU 的活动总和有什么用?

我正在构建一个监视器来跟踪所有 Linux /proc 数据,这些数据对于了解服务器的行为非常有用。但我仍然不明白我是否应该跟踪每个 CPU(在虚拟环境中,它们可能有很多),或者我是否可以只跟踪总体 CPU 活动(基本上是单个 CPU 的总和)。

跟踪每一个 CPU 意味着要存档大量的数据,而总 CPU 只是一个和所有其他 CPU 的总和(甚至比查看 10-12 个不同的图表更具可读性)。

我真的很想使用 Total CPU,但我想知道是否存在特定情况,通过跟踪每个 CPU 可以“挽救”系统管理员的生命。

是否存在总 CPU 数量可能低于 CPU 活动的分析结果的情况?

答案1

中断!默认情况下,内核将所有中断绑定到一个核心(通常是第一个)。如果不使用 irqbalance 服务,您的系统可能会总体负载较低,但单个核心运行 100%,从而限制了服务器性能。

相关内容