为什么 ZFS 发送/接收会通过我的 LAN 发送如此多的数据？

Question

从你提到的压缩来看，我假设你描述的所有存储大小/速度都是未压缩的大小。如果不是，那么可以使传输时间延长一个等于平均压缩率的倍数（但如果磁盘访问是瓶颈则不然，因为解压缩/压缩发生在从磁盘读取之后zfs send和写入磁盘之前zfs receive）。

根据您目前收集的信息，您的瓶颈似乎是磁盘带宽，而不是网络连接。您提到每个系统都可以以 ~500MB/s 的速度读取/写入，因此 35TB 的最佳传输时间约为 20 小时（比仅通过 10Gb/s 网络传输慢 2.5 倍）。但是，根据您的镜像设置，我很惊讶读取和写入会获得相同的吞吐量 - 您确定吗？在发送系统上，您只需要从一个磁盘读取（因此您可以在三个磁盘上并行读取），但在接收系统上，您必须写入所有三个磁盘（因此您在任何给定时间都受到最慢磁盘的吞吐量的限制）。要测试接收端的写入吞吐量，您可以运行dd if=/dev/urandom of=some_file_in_pool bs=1M count=1024 conv=fdatasync。

由于您说接收磁盘处于 100% 繁忙状态，我猜测它没有达到 500MB/s 的写入带宽。这可能是因为实际写入限制低于该值（dd上面的命令应该可以确认），也可能是系统在接收期间必须执行元数据读取，这会通过添加大量磁盘寻道来破坏您良好的大 IO 大小写入工作负载。您应该能够使用 DTrace 更深入地调查第二个假设，以查看提供商io认为您的读/写大小是多少。

Answer 1

从你提到的压缩来看，我假设你描述的所有存储大小/速度都是未压缩的大小。如果不是，那么可以使传输时间延长一个等于平均压缩率的倍数（但如果磁盘访问是瓶颈则不然，因为解压缩/压缩发生在从磁盘读取之后zfs send和写入磁盘之前zfs receive）。

根据您目前收集的信息，您的瓶颈似乎是磁盘带宽，而不是网络连接。您提到每个系统都可以以 ~500MB/s 的速度读取/写入，因此 35TB 的最佳传输时间约为 20 小时（比仅通过 10Gb/s 网络传输慢 2.5 倍）。但是，根据您的镜像设置，我很惊讶读取和写入会获得相同的吞吐量 - 您确定吗？在发送系统上，您只需要从一个磁盘读取（因此您可以在三个磁盘上并行读取），但在接收系统上，您必须写入所有三个磁盘（因此您在任何给定时间都受到最慢磁盘的吞吐量的限制）。要测试接收端的写入吞吐量，您可以运行dd if=/dev/urandom of=some_file_in_pool bs=1M count=1024 conv=fdatasync。

由于您说接收磁盘处于 100% 繁忙状态，我猜测它没有达到 500MB/s 的写入带宽。这可能是因为实际写入限制低于该值（dd上面的命令应该可以确认），也可能是系统在接收期间必须执行元数据读取，这会通过添加大量磁盘寻道来破坏您良好的大 IO 大小写入工作负载。您应该能够使用 DTrace 更深入地调查第二个假设，以查看提供商io认为您的读/写大小是多少。

为什么 ZFS 发送/接收会通过我的 LAN 发送如此多的数据？

答案1

相关内容