奇怪的 Azure VM 性能问题

Question

感谢 Reddit 上可爱的朋友们，我找到了解决方案。因此，我们正在运行可突发虚拟机（B 系列），有人向我指出，这些虚拟机具有“随时间爆发的配额”。

深入研究后，我发现这个提示非常准确。我知道这些虚拟机是可突发的，但我不知道如何测量或限制。

经过大量的挖掘和验证假设后，使用 Azure 监视器查看所有虚拟机上的 CPU 百分比以及“剩余 CPU 积分”指标，结果显示 CPU 积分即将耗尽，因此 CPU 上限为 40%，直到负载减少或积分累积完成。

当停止和取消分配虚拟机时，信用额度将被重置为基线，并且在客户完成工作之前，信用额度永远不会被用完。

非常感谢您为我指明了正确的方向，这为我们省去了很多麻烦。

现在我们已将规模增加了一倍，并且它一直运行良好，并且信用额度不会降为零。

这种情况是本周才开始发生的，因为我们在周一和周二运行备份工作，所以当备份开始时，中午左右的 CPU 使用率较高，而下午 4 点左右信用额度就会下降。

本周剩余时间加强监控并试图通过增加使用量来引发问题确实导致问题再次发生但被推迟了。

此外，在分析过程中，我们意识到这个特定的用户只是在同时执行更多操作，因此 CPU 更频繁地超过 CPU 基线，从而进一步减少 CPU 积分。

在我们弄清楚这一点大约两个小时后，微软也得出了同样的结论。

感谢大家的意见，特别是 Reddit 用户 /u/VTi-R，我非常感激！

Answer 1