重复数据删除卷的差异备份

重复数据删除卷的差异备份

我们目前每周对我们的虚拟机进行一次完整的远程备份。这需要整个周末的时间,如果可能的话,我想加快这个过程。

我们使用 Dedup 备份虚拟机,备份大小为 300GB,使用 128KB 块大小。我们的小型办公室连接最多可以实现 10mbit 的上行速度,这大约相当于 3 天备份 300GB。

您是否认为 128kb 的块大小对于此应用程序来说太大?是否应该以系统开销为代价降低块大小,并享受较小备份卷的好处?

我们可以通过 rsync 和 Dedup 进行差异备份,从而无需完整备份吗?

欢迎任何建议/意见。

谢谢

答案1

我假设您期望重复数据删除的最大收益来自虚拟机映像的操作系统部分。在这种情况下,如果您的虚拟机不是彼此的克隆,那么我会说 128 KiB 对于最佳重复数据删除来说太大了。如果您的瓶颈是网络,并且更高效的重复数据删除会有所帮助,我会大大降低。如果您要对磁盘映像进行重复数据删除,那么最佳大小将是最小虚拟机操作系统级分配单元。在 Linux 中,这是 ext3 和 ext4 文件系统中的 4KB 块(默认情况下)。对于更大的块大小,请注意分区,由于虚拟磁盘布局不同,您可能将相同的系统偏移了重复数据删除块大小的一半。

对于一个相当模糊的问题很难给出更好的答案。

答案2

VMware ESX4+ 改变了块跟踪,允许备份软件确定要备份哪些块,而不是整个磁盘。然后,备份软件可以将更改转入第一次完整备份,从根本上消除了每周进行完整备份的需要。

相关内容