Linux 上的 SSD IOPS，DIRECT 比缓冲、fio 快得多

Question

带有 3.2 内核的 Debian 7.11

如果可能的话，请升级。您不仅会获得内核改进，而且 Wheezy 的生命周期也将结束。

是的，当 direct=1 时，您会看到更高的利用率和队列深度。fio 手册特别提到了这种情况（重点是我的）：

io深度=int

针对文件保持飞行状态的 I/O 单元数。请注意，将 iodepth 增加到 1 以上不会影响同步 ioengines（使用 verify_async 时的小程度除外）。即使是异步引擎也可能施加 OS 限制，导致无法实现所需的深度。当使用 libaio 并且未设置 direct=1 时，Linux 上可能会发生这种情况，因为该操作系统上的缓冲 I/O 不是异步的。密切关注 fio 输出中的 I/O 深度分布，以验证实现的深度是否符合预期

因此，libaio 需要 O_DIRECT 才能实现异步，这是一个需要了解的重要实现细节。有人问，不直接使用 libaio 是否是个好主意：

使用 libaio 时设置 direct=0 是否有效？

你可以这样做，但我不建议这样做。在当今的 Linux 内核中，如果没有 O_DIRECT，libaio 提交很可能会变成阻塞（因此不再是异步的），这会限制实现的并行 I/O 数量。有强有力的论据表明，fio 示例不应鼓励这种选项组合...

手册文档中的“排队”行为是什么意思？

如果你指的是“请注意，Linux 可能仅支持非缓冲 I/O 的排队行为”（在 http://fio.readthedocs.io/en/latest/fio_doc.html#io-engine）我认为它试图表达的是：

“当使用 direct=1 和 libaio 时，您可以提交一个 I/O 并让内核将其异步排队，从而允许提交系统调用立即返回，并为您提供在 I/O 完成之前排队其他提交的机会，而不是阻塞提交系统调用直到 I/O 关闭并从最低的磁盘设备返回（阻塞行为）。

还可以尝试使用 ioengine=psync 和 direct=0 进行控制测试。即使使用缓存进行同步写入也可以实现大量 IOPS。

所有这些都回避了真正的问题：您正在运行的数据库工作负载存在什么问题？问题症状、软件版本、配置、性能指标（iostat）。DBMS 的 I/O 实现可能与您模拟的、使用的系统调用、执行 I/O 的多个文件和作业等任何事情大不相同。如果您想进一步调查，这是一个值得思考的问题。

Answer 1