IO 等待利用率和平均负载之间有什么关系

Question

（假设是 Linux，尽管一般概念可以应用于其他操作系统。）

工作负载不能仅通过平均负载和 %iowait 来描述。这些指标仅汇总处于特定状态的任务。分别是可运行和不可中断的计数、空闲时间和 I/O 未完成。

您可能会遇到这样的情况：有些任务处于可运行状态，有些 CPU 周期处于空闲状态，但 I/O 却处于非空闲状态。想象一下一个相当繁忙的 Web 服务器，200 个工作进程在 2 个 CPU 上运行。平均负载约为 1，iowait 接近 0。任务很多，但每个任务的工作量不大，CPU 空闲但等待磁盘的时间更少。

如果这个假设的 Web 服务器虚拟机被实时迁移，其内存延迟和可用 CPU 时间可能会短暂受到影响。症状可能是平均负载更高，但这不会导致 iowait。

采取综合方法来查看系统的所有组件；这远远超出了顶层。例如，考虑利用率、饱和度和错误一切。当性能工具可以计算和分析几乎任何事物时，为什么只满足于不能说明全部情况的相同老方法呢？

Answer 1

（假设是 Linux，尽管一般概念可以应用于其他操作系统。）

工作负载不能仅通过平均负载和 %iowait 来描述。这些指标仅汇总处于特定状态的任务。分别是可运行和不可中断的计数、空闲时间和 I/O 未完成。

您可能会遇到这样的情况：有些任务处于可运行状态，有些 CPU 周期处于空闲状态，但 I/O 却处于非空闲状态。想象一下一个相当繁忙的 Web 服务器，200 个工作进程在 2 个 CPU 上运行。平均负载约为 1，iowait 接近 0。任务很多，但每个任务的工作量不大，CPU 空闲但等待磁盘的时间更少。

如果这个假设的 Web 服务器虚拟机被实时迁移，其内存延迟和可用 CPU 时间可能会短暂受到影响。症状可能是平均负载更高，但这不会导致 iowait。

采取综合方法来查看系统的所有组件；这远远超出了顶层。例如，考虑利用率、饱和度和错误一切。当性能工具可以计算和分析几乎任何事物时，为什么只满足于不能说明全部情况的相同老方法呢？

IO 等待利用率和平均负载之间有什么关系

答案1

相关内容