ZFS 快照回滚的速度是否取决于文件数量？

Question 1

zfs send/recv 流中涉及的文件和目录数量应该不会对其传输速度产生直接影响。但可能会间接影响，因为通常来说，随着目录/文件的增多，数据集在磁盘上的“分布”会更高，具体取决于生成它们的工作负载。这很重要，因为对于硬盘来说，顺序读取比随机读取要容易得多——如果所涉及的流遍布整个磁盘，则随机读取工作负载将远远大于顺序读取。

此外，据我了解，ZFS 文件系统（而不是 zvols）上的文件涉及 ZFS 元数据；我没有直接的数字，但对于单个 2.5 TB 文件，总体而言，与其关联的元数据块明显少于包含 1500 万个文件的 2.5 TB 文件，我并不感到惊讶。这些（可能很多）额外的元数据块将添加更多必须读取的数据，因此需要进行更多的磁盘读取（并可能进行更多搜索）。因此，是的，间接地，由 1500 万个文件组成的发送流可能比由相同大小的单个文件组成的发送流创建速度更慢（尤其是如果该文件是一次性创建的，作为顺序写入，在当时有大量连续可用空间的池中）。

ZFS 发送/接收流在未缓冲的情况下发送时，性能很不稳定，这种情况很常见 - 有时它们似乎运行得很快，然后在很长一段时间内会降至几乎为零。互联网上的各种论坛已经对这种行为进行了描述，甚至进行了某种程度的分析，所以我就不多说了。总的来说，虽然 ZFS 可以而且应该做一些工作来使其内部工作流程更高效，但许多问题的“快速修复”是在发送和接收端引入缓冲区。为此，最常用的工具是“mbuffer”。

如果底层问题可以通过添加缓冲区来解决，那么通过在 netcat 之前通过 mbuffer 传输 zfs send（并在 zfs recv 之前再次通过 mbuffer 传输），您应该会看到明显的改善。Alasdair 在他的博客上对此进行了简要的描述——我目前没有关于这个主题的任何发布，所以我将向您指出他的：http://blogs.everycity.co.uk/alasdair/2010/07/using-mbuffer-to-speed-up-slow-zfs-send-zfs-receive/

Answer

zfs send/recv 流中涉及的文件和目录数量应该不会对其传输速度产生直接影响。但可能会间接影响，因为通常来说，随着目录/文件的增多，数据集在磁盘上的“分布”会更高，具体取决于生成它们的工作负载。这很重要，因为对于硬盘来说，顺序读取比随机读取要容易得多——如果所涉及的流遍布整个磁盘，则随机读取工作负载将远远大于顺序读取。

此外，据我了解，ZFS 文件系统（而不是 zvols）上的文件涉及 ZFS 元数据；我没有直接的数字，但对于单个 2.5 TB 文件，总体而言，与其关联的元数据块明显少于包含 1500 万个文件的 2.5 TB 文件，我并不感到惊讶。这些（可能很多）额外的元数据块将添加更多必须读取的数据，因此需要进行更多的磁盘读取（并可能进行更多搜索）。因此，是的，间接地，由 1500 万个文件组成的发送流可能比由相同大小的单个文件组成的发送流创建速度更慢（尤其是如果该文件是一次性创建的，作为顺序写入，在当时有大量连续可用空间的池中）。

ZFS 发送/接收流在未缓冲的情况下发送时，性能很不稳定，这种情况很常见 - 有时它们似乎运行得很快，然后在很长一段时间内会降至几乎为零。互联网上的各种论坛已经对这种行为进行了描述，甚至进行了某种程度的分析，所以我就不多说了。总的来说，虽然 ZFS 可以而且应该做一些工作来使其内部工作流程更高效，但许多问题的“快速修复”是在发送和接收端引入缓冲区。为此，最常用的工具是“mbuffer”。

如果底层问题可以通过添加缓冲区来解决，那么通过在 netcat 之前通过 mbuffer 传输 zfs send（并在 zfs recv 之前再次通过 mbuffer 传输），您应该会看到明显的改善。Alasdair 在他的博客上对此进行了简要的描述——我目前没有关于这个主题的任何发布，所以我将向您指出他的：http://blogs.everycity.co.uk/alasdair/2010/07/using-mbuffer-to-speed-up-slow-zfs-send-zfs-receive/

Question 2

速度差异如此之大的原因在于传输文件和快照是无法比较的。文件是顺序 I/O，而快照是随机 I/O，因为它包含已更改的块。

Answer

速度差异如此之大的原因在于传输文件和快照是无法比较的。文件是顺序 I/O，而快照是随机 I/O，因为它包含已更改的块。

ZFS 快照回滚的速度是否取决于文件数量？

答案1

答案2

相关内容