如何调查持续数小时的 100% CPU 事件的原因？

Question

如果你有 CPU 负载图，它们可能会让你进一步了解 CPU 当时正在做什么。例如，它可能正在等待磁盘 IO，这称为等待。

如果这些都不可用，而且您很难找到原因，那么此事件很可能归咎于主机服务器上的问题。也许是一个嘈杂的邻居的问题：同一主机上的虚拟机行为不当，或者硬件故障（如磁盘，这可能导致高 IOWAIT）。

有一个名为 atop 的实用程序，它将保存您的进程的详细记录，并会在此处显示答案。atop 将每 xx 分钟（可配置）对所有进程和资源使用情况进行“快照”。这现在不会对您有所帮助，但如果再次发生这种情况，它将有所帮助。有关更多信息，请参阅 atop 网站：https://www.atoptool.nl/

Ps：Ubuntu 12.04 已达到使用寿命终止状态，您应该考虑升级机器，因为此版本不再提供安全更新。请参阅 Ubuntu 发布周期：https://ubuntu.com/about/release-cycle

Answer 1

如果你有 CPU 负载图，它们可能会让你进一步了解 CPU 当时正在做什么。例如，它可能正在等待磁盘 IO，这称为等待。

如果这些都不可用，而且您很难找到原因，那么此事件很可能归咎于主机服务器上的问题。也许是一个嘈杂的邻居的问题：同一主机上的虚拟机行为不当，或者硬件故障（如磁盘，这可能导致高 IOWAIT）。

有一个名为 atop 的实用程序，它将保存您的进程的详细记录，并会在此处显示答案。atop 将每 xx 分钟（可配置）对所有进程和资源使用情况进行“快照”。这现在不会对您有所帮助，但如果再次发生这种情况，它将有所帮助。有关更多信息，请参阅 atop 网站：https://www.atoptool.nl/

Ps：Ubuntu 12.04 已达到使用寿命终止状态，您应该考虑升级机器，因为此版本不再提供安全更新。请参阅 Ubuntu 发布周期：https://ubuntu.com/about/release-cycle

如何调查持续数小时的 100% CPU 事件的原因？

答案1

相关内容