Linux 软件 raid-10 性能不佳

Question

编辑：

您的dd oflag=direct观察结果可能是由于电源管理问题造成的。使用电源TOP查看在写入负载下，CPU 的 C 状态是否过于频繁地切换至 C1 以上。如果是，请尝试调整 PM 以确保 CPU 不会进入休眠状态并重新运行基准测试。请参阅发行版的文档以了解如何执行此操作 - 在大多数情况下，这将是intel_idle.max_cstate=0内核引导行参数，但 YMMV。

写入和缓冲写入之间的性能巨大差异O_DIRECT可能是由于：

当使用 O_DIRECT 时，CPU 不会进入 C3+ 睡眠状态或
CPU 被送入 C3+，但由于使用 O_DIRECT 时处理过程显著简化，因此这并不那么重要 - 只需指向归零的内存区域并发出 DMA 写入请求，所需的周期数比缓冲处理要少，并且对延迟的敏感度较低

过时的答案：

这看起来很像是单线程造成的瓶颈md。

推理

这控制器数据表有望实现 6,000 的吞吐量
您的并行dd运行显示每个驱动器 170MB _/s +，因此路径不受连接 PCIe 带宽的限制
您会看到 md10_raid10 的利用率高达接近 100%

虽然针对多线程 RAID5 校验和计算的补丁已承诺mdraid在 2013 年，我找不到任何有关类似 RAID1 / RAID10 增强功能的信息，所以它们可能根本不存在。

可以尝试的事情

不止一个写作线程dd，只是为了看看它是否改变了什么
不同的 RAID10 实现 -LVM RAID 10但你也可能想到看看 ZFS^{1 的}设计正是考虑到了这种用例（许多磁盘，没有硬件 RAID 控制器）
可能是较新的内核版本

值得一提的是，在使用机械存储介质时，您很少（如果有的话）会看到带宽上的写入性能达到峰值（尤其是使用非 CoW 文件系统）。大多数时候，您会受到寻道时间的限制，因此峰值带宽不应该成为大问题，只要它满足您的最低要求即可。

¹如果你做ZFS，您应该改进测试方法，因为将全零块写入 ZFS 数据集的速度可能非常快。如果为数据集启用了压缩，则零不会写入磁盘，而只是链接到全零块。

Answer 1

编辑：

您的dd oflag=direct观察结果可能是由于电源管理问题造成的。使用电源TOP查看在写入负载下，CPU 的 C 状态是否过于频繁地切换至 C1 以上。如果是，请尝试调整 PM 以确保 CPU 不会进入休眠状态并重新运行基准测试。请参阅发行版的文档以了解如何执行此操作 - 在大多数情况下，这将是intel_idle.max_cstate=0内核引导行参数，但 YMMV。

写入和缓冲写入之间的性能巨大差异O_DIRECT可能是由于：

当使用 O_DIRECT 时，CPU 不会进入 C3+ 睡眠状态或
CPU 被送入 C3+，但由于使用 O_DIRECT 时处理过程显著简化，因此这并不那么重要 - 只需指向归零的内存区域并发出 DMA 写入请求，所需的周期数比缓冲处理要少，并且对延迟的敏感度较低

过时的答案：

这看起来很像是单线程造成的瓶颈md。

推理

这控制器数据表有望实现 6,000 的吞吐量
您的并行dd运行显示每个驱动器 170MB _/s +，因此路径不受连接 PCIe 带宽的限制
您会看到 md10_raid10 的利用率高达接近 100%

虽然针对多线程 RAID5 校验和计算的补丁已承诺mdraid在 2013 年，我找不到任何有关类似 RAID1 / RAID10 增强功能的信息，所以它们可能根本不存在。

可以尝试的事情

不止一个写作线程dd，只是为了看看它是否改变了什么
不同的 RAID10 实现 -LVM RAID 10但你也可能想到看看 ZFS^{1 的}设计正是考虑到了这种用例（许多磁盘，没有硬件 RAID 控制器）
可能是较新的内核版本

值得一提的是，在使用机械存储介质时，您很少（如果有的话）会看到带宽上的写入性能达到峰值（尤其是使用非 CoW 文件系统）。大多数时候，您会受到寻道时间的限制，因此峰值带宽不应该成为大问题，只要它满足您的最低要求即可。

¹如果你做ZFS，您应该改进测试方法，因为将全零块写入 ZFS 数据集的速度可能非常快。如果为数据集启用了压缩，则零不会写入磁盘，而只是链接到全零块。

Linux 软件 raid-10 性能不佳

答案1

编辑：

过时的答案：

推理

可以尝试的事情

相关内容