单个磁盘上的 ZFS 读取行为

Question

观察到的行为是由于 ZFS 如何进行端到端校验和，它基于记录大小概念。

基本上，每个对象被分解成适当数量的记录大小的块，这些块分别进行校验和。这意味着小于记录大小的读取确实需要传输并重新校验所有的记录大小的对象，导致“浪费”存储带宽。

这意味着大记录大小的 ZFS 数据集在小读取时表现不佳，相反，在大读取时表现良好。相反，小记录大小的 ZFS 数据集在小读取时表现良好，在大读取时表现不佳。

请注意，压缩和快照也适用于记录大小粒度：记录大小为 4K 或 8K 的数据集的压缩率将比 32K 数据集低得多。

简而言之，ZFS recordsize 没有“万无一失”的值，您需要根据特定应用程序的要求进行调整。这也意味着它dd不是基准测试的良好选择（尽管它既快速又粗糙，我也广泛使用它！）；相反，您应该使用fio（调整为与您的应用程序一样运行）或应用程序本身。

你可以阅读这里了解更多信息。

对于一般用途，我会将其保留为默认值（128K），而对于数据库和虚拟机，我会使用小得多的 32K 值。

最后，注意 ZFS 预读/预取调整，这可以显著提高读取速度。

Answer 1