如果不以磁盘块大小的倍数执行读/写操作，为什么性能会下降？

Question

为什么“尽管需要的调用较少，但 1,130 字节请求最终会生成未对齐的请求，因此效率低于 1,024 字节请求”？

我将提供概念模型。内核可能有一些优化来减少这个问题（但不会让问题完全消失）。

如果块大小为 1024，那么您将拥有一系列块：

[1, 1024], [1025, 2048], [2049, 3076], [3077, 4096], ...

如果写入大小为 1130 的块，则对write()系统调用的第一次调用必须写入两个磁盘块才能满足一个请求。它首先将前 1024 个字节写入 block [1, 1024]，留下 106 个字节未写入。然后它将读取第二个块 ( [1025, 2048])，将剩余的 106 字节复制到该块的前 106 字节中，然后将该块写回磁盘。

对系统调用的下一次调用write()必须再次读取第二个块 ( [1025, 2048])，将要写入的 1130 字节中的前 918 个字节 (1024-106) 复制到[1131, 2048]该块的字节中，然后将该块写回磁盘。然后它将读取第三个块 ( [2049, 3076])，将 1130 的最后 212 字节写入该块的前 212 字节，然后将该块写回磁盘。

这种模式仍在继续——尽管对的调用较少write()，但内核必须重复读取/更新/写入现有块，而不是简单地写入块。

如果将 s 与块大小对齐write()，则不会出现“读取块，更新其中一部分，写回”的情况，它可以只写入块并继续前进，并且您不必读取/更新同一块以满足对write().

如果“内核通过延迟写入、合并相邻 I/O 请求和预读来内部缓冲数据”，为什么我们需要用户缓冲区？内核缓冲区不是已经完成了用户缓冲区所做的工作吗？

用户空间不能直接访问内核空间缓冲区。用户空间缓冲区对于使程序能够读取“块”而无需对每个字节进行系统调用（如 Love 所示效率低下）是必需的。

“文件系统操作以块的形式发生”是否意味着操作以块或块的任何整数倍的形式发生？

我认为这取决于设备以及用于与存储设备通信的协议。

Answer 1