使用另一台服务器的 ZFS 备份建议

Question

我会使用增量 ZFS 发送/接收。它应该比rsyncZFS 知道自上一个快照以来发生了什么更改而无需探索整个文件系统更有效。

假设您要完全备份名为的文件系统datapool/fs。

首先创建一个池来将备份存储在目标服务器上，并在源池上存储递归快照：

dest # zpool create datapool ...
source # zfs snapshot -r datapool/fs@snap1

然后您发送整个数据作为初始备份：

source # zfs send -R datapool/fs@snap1 | ssh dest zfs receive datapool/fs

下周（或您喜欢的任何时间段），您将在源池上创建第二个快照并将其增量发送到目标上。那时，ZFS 足够聪明，只发送一周内更改的内容（删除、创建和修改的文件）。当文件被修改时，它不会作为一个整体发送，而只会传输和更新修改后的块。

source # zfs snapshot -r datapool/fs@snap2
source # zfs send -ri snap1 datapool/fs@snap2 | 
            ssh dest zfs receive -F datapool/fs

每次备份时增加快照编号，重复该操作。

当您不再需要它们时，删除任一服务器上未使用的旧快照。

如果您有带宽限制，您可以动态压缩/解压缩数据，例如在管道中插入gzip/zip命令或启用 ssh 压缩。

source # zfs send -ri snap1 datapool/fs@snap2 | gzip | 
            ssh dest "gunzip | zfs receive -F datapool/fs"

您还可以利用mbuffer获得更稳定的带宽使用，如此处所述页:

dest # mbuffer -s 128k -m 1G -I 9090 | zfs receive datapool/fs

source # zfs send -i snap2 datapool/fs@snap3 | 
            mbuffer -s 128k -m 1G -O w.x.y.z:9090

注意：该zfs -r标志对于非 Solaris ZFS 实现不可用，请参见 http://lists.freebsd.org/pipermail/freebsd-fs/2012-September/015074.html。在这种情况下，不要-F在目标上使用该标志，而是显式回滚数据集。如果在源上创建了新数据集，请先独立发送它们，然后再进行快照+增量发送/接收。

当然，如果您只有一个文件系统要备份而没有底层数据集层次结构，或者如果您想要执行独立备份，则增量备份更容易实现，并且无论 ZFS 实现如何，都应该以相同的方式工作：

T0:

zfs snapshot datapool/fs@snap1
zfs send datapool/fs@snap1 | ssh dest zfs receive datapool/fs

T1：

zfs snapshot datapool/fs@snap2
zfs send -i snap1 datapool/fs@snap2 | 
            ssh dest zfs receive -F datapool/fs

Answer 1