Linux - 实际硬件 RAID 控制器调整（scsi 和 cciss）

Question 1

我发现，当我必须调整以降低延迟与吞吐量时，我会将 nr_requests 从其默认值调低（低至 32）。其理念是，更小的批次等于更低的延迟。

对于 read_ahead_kb，我发现对于顺序读取/写入，增加此值可以提供更好的吞吐量，但我发现此选项实际上取决于您的工作负载和 IO 模式。例如，在我最近调整的数据库系统上，我将此值更改为匹配单个数据库页面大小，这有助于减少读取延迟。在我的案例中，增加或减少超过此值都会损害性能。

至于块设备队列的其他选项或设置：

最大扇区数= 我已将此值设置为与硬件允许的单次传输值相匹配（检查 sysfs 中的 max_hw_sectors_kb（RO）文件的值以查看允许的值）

名词= 这可让您禁用或调整合并 io 请求的查找逻辑。（关闭此功能可以节省一些 CPU 周期，但我没有看到在我的系统中更改此功能有什么好处，因此我将其保留为默认设置）

rq_affinity= 我还没有尝试过，但是这是内核文档中对此的解释

如果此选项为“1”，则块层将请求完成迁移到最初提交请求的 CPU“组”。对于某些工作负载，由于缓存效应，这可以显著减少 CPU 周期。
对于需要最大化完成处理分布的存储配置，将此选项设置为“2”会强制完成在请求的 CPU 上运行（绕过“组”聚合逻辑）”

调度程序= 您说您尝试了 deadline 和 noop。我测试了 noop 和 deadline，但在我最近为数据库服务器进行的测试中发现 deadline 胜出。

NOOP 表现良好，但对于我们的数据库服务器，我仍然能够通过调整截止期限调度程序实现更好的性能。

位于 /sys/block/{sd,cciss,dm-}*/queue/iosched/ 下的截止期限调度程序的选项：

fifo_batch= 有点像 nr_requests，但特定于调度程序。经验法则是将其调低以降低延迟或调高以增加吞吐量。控制读取和写入请求的批处理大小。

写入有效期= 设置批量写入的过期时间，默认为 5000ms。再次降低此值可降低写入延迟，而增加此值可提高吞吐量。

读取过期时间= 设置读取批次的过期时间，默认为 500ms。此处适用相同规则。

前端合并= 我倾向于关闭此功能，但默认情况下它是打开的。我认为调度程序没有必要浪费 CPU 周期来尝试合并 IO 请求。

写入饥饿= 由于 deadline 是针对读取的，因此这里的默认值是在处理写入批次之前处理 2 个读取批次。我发现默认值 2 对我的工作量来说很合适。

Answer

我发现，当我必须调整以降低延迟与吞吐量时，我会将 nr_requests 从其默认值调低（低至 32）。其理念是，更小的批次等于更低的延迟。

对于 read_ahead_kb，我发现对于顺序读取/写入，增加此值可以提供更好的吞吐量，但我发现此选项实际上取决于您的工作负载和 IO 模式。例如，在我最近调整的数据库系统上，我将此值更改为匹配单个数据库页面大小，这有助于减少读取延迟。在我的案例中，增加或减少超过此值都会损害性能。

至于块设备队列的其他选项或设置：