iowait 绑定服务器 - 负载计算和进程调度

Question

平均负载和 CPU 利用率

平均负载是衡量 CPU 上可运行任务数量的一个缓慢移动指标。除了，Linux 早期决定也计算不可中断任务，以期捕捉 I/O 负载。低于 CPU 数量的负载肯定可以运行更多任务，但建议的最大值并不那么明显。

现代系统中的磁盘 I/O 几乎不需要 CPU 参与。因此，iowait 几乎处于空闲状态。用户 + 系统如此之低表明 CPU 在等待非常慢的主轴时几乎无事可做。

每个物理主轴限制为一个坏块。多个坏块可能会导致磁盘头来回寻找，从而导致性能不佳。

SAS 卡或存储系统的其他组件也可能存在瓶颈。当您看到 I/O 带宽（可能通过iotop）不再增加时，请使用较少的进程。或者每次只选择 8 个左右作为任意大小的批处理以并行运行（可能使用GNU并行）。

任务调度程序正在针对多个方面进行优化。即使在多 CPU 系统中，专注于几个核心也可以使数据在缓存中保持热度，降低空闲核心的速度以节省电量，并且仍然能够处理中断。此外，还需要考虑 NUMA 和 SMT 调度，尽管此 CPU 不具备这些功能。

在这种情况下，您有两个几乎空闲的内核。我希望主机能够相当敏捷。不过，在执行此操作时不要运行太多工作。有限的 I/O 带宽和 IOPS 可能会让 CPU 等待，而工作量却不会增加。

Answer 1

平均负载是衡量 CPU 上可运行任务数量的一个缓慢移动指标。除了，Linux 早期决定也计算不可中断任务，以期捕捉 I/O 负载。低于 CPU 数量的负载肯定可以运行更多任务，但建议的最大值并不那么明显。

现代系统中的磁盘 I/O 几乎不需要 CPU 参与。因此，iowait 几乎处于空闲状态。用户 + 系统如此之低表明 CPU 在等待非常慢的主轴时几乎无事可做。

每个物理主轴限制为一个坏块。多个坏块可能会导致磁盘头来回寻找，从而导致性能不佳。

SAS 卡或存储系统的其他组件也可能存在瓶颈。当您看到 I/O 带宽（可能通过iotop）不再增加时，请使用较少的进程。或者每次只选择 8 个左右作为任意大小的批处理以并行运行（可能使用GNU并行）。

任务调度程序正在针对多个方面进行优化。即使在多 CPU 系统中，专注于几个核心也可以使数据在缓存中保持热度，降低空闲核心的速度以节省电量，并且仍然能够处理中断。此外，还需要考虑 NUMA 和 SMT 调度，尽管此 CPU 不具备这些功能。

在这种情况下，您有两个几乎空闲的内核。我希望主机能够相当敏捷。不过，在执行此操作时不要运行太多工作。有限的 I/O 带宽和 IOPS 可能会让 CPU 等待，而工作量却不会增加。