Azure 指标的 CPU 百分比异常

Azure 指标的 CPU 百分比异常

我目前无法解释 Azure VM 上的以下行为。该 VM 是标准 DS4 v2 Promo(8 vcpus,28 GB 内存),新安装了 Ubuntu 18.04。

我使用 生成了一些工作量stress --cpu 1

现在,如果我通过 Azure 门户以 1 分钟为粒度检查平均主机 CPU 百分比指标,我会看到预期的 CPU 百分比约为 13%,而如果我使用最大值进行聚合,则 CPU 百分比约为 97%。

值得补充的是,使用stress --io 1不会产生平均聚合和最大聚合之间的相同比率(~7%,~30%)。

另外,我一直在监控客户操作系统,测试期间没有其他任何运行。

有人知道是什么原因导致这样的结果吗? 在这种情况下,使用最大值聚合主机 CPU 百分比有什么意义吗?

问候。

答案1

在一段时间内将 CPU 最大化并不是很有用。很久以前有些任务(启动时、计划任务)就占用了最大的 CPU,但这可能不代表现在的 CPU 使用率。

绘制数据图表并查看趋势。与客户机平均负载进行比较,以显示一段时间内的可运行任务。

持续的高 CPU 使用率(例如连续几个样本的 CPU 使用率达到 97%)对于监控或警报来说更有意义。即便如此,也取决于工作负载:对于 CPU 密集型的后台编译工作负载,97% 可能可以忍受,但对于繁忙的 Web 服务器来说,97% 会破坏响应时间。

--cpu 与 --io 的工作完全不同。--cpu 进行一些数学运算以保持 CPU 资源繁忙,而 --io 进行存储工作,其中 CPU 大部分时间都在等待磁盘。

相关内容