虚拟机 CPU 使用率达到 100%

Question 1

有 4 个 ksoftirqd 占用了 39% 的 CPU。这个比例相当高，可能表明存在许多问题，例如 I/O 负载过高、电源管理问题或内核/设备驱动程序错误。

尝试更新到最新的内核，确保选择了适当的变体（例如，有专门针对 AWS 和 Azure 调整的 Ubuntu 内核），并查看一些 Linux I/O 性能故障排除工具。

关于 Linux 性能故障排除的一个很好的资源通常是Brendan Gregg 的博客

Answer

有 4 个 ksoftirqd 占用了 39% 的 CPU。这个比例相当高，可能表明存在许多问题，例如 I/O 负载过高、电源管理问题或内核/设备驱动程序错误。

尝试更新到最新的内核，确保选择了适当的变体（例如，有专门针对 AWS 和 Azure 调整的 Ubuntu 内核），并查看一些 Linux I/O 性能故障排除工具。

关于 Linux 性能故障排除的一个很好的资源通常是Brendan Gregg 的博客

Question 2

看起来内核正在使用大量 CPUkworker线程，这通常是由有缺陷的内核驱动程序引起的。

要进行调试，请使用触发回溯echo l > /proc/sysrq-trigger，这将导致在中生成输出dmesg。运行几次以查看是否一致。基于此主题哪个驱动程序导致高负载可能很明显。有一种想法是，如果您在 ESXi 上运行此程序，则 e1000 网络接口驱动程序是出了名的错误多多。

Answer

看起来内核正在使用大量 CPUkworker线程，这通常是由有缺陷的内核驱动程序引起的。

要进行调试，请使用触发回溯echo l > /proc/sysrq-trigger，这将导致在中生成输出dmesg。运行几次以查看是否一致。基于此主题哪个驱动程序导致高负载可能很明显。有一种想法是，如果您在 ESXi 上运行此程序，则 e1000 网络接口驱动程序是出了名的错误多多。

相关内容