tar 档案的重复数据删除

tar 档案的重复数据删除

现在,我尝试在我的 Linux 备份服务器上配置带有重复数据删除功能的 ZFS,并且有一个问题。例如,我的 backup1.tar 中有 1k 个文件,backup2.tar 中有 1k 个相同的文件和 1 个新文件。这些文件是否会被重复数据删除?据我所知,它不适用于 tar 存档。也许我做错了什么。

答案1

tar 中的某些块可能会相同,但可能性很小。ZFS 在块级别(在 ZFS 术语中称为记录大小)进行重复数据删除,因此各个块必须相同。tar 基本上可以保证包含完全相同的内容,但能否组成整个块并进行块对齐则不太可能。

如果您想利用 ZFS 重复数据删除功能进行备份,请使用快照和发送/接收功能。这通常具有使用空闲空间的缺点(存储以记录大小块的形式分配给文件,如果文件未使用整个块,则剩余空间将被浪费)。Tar 避免了这个“问题”,但您必须创建增量 tar 备份才能重现重复数据删除效果。

答案2

ZFS 重复数据删除是基于块的,因此它应该考虑档案的内容。

  • TAR 档案有多大?
  • 您是否已启用压缩?
  • 您使用什么方法来确定重复数据删除率?标准方法是:zpool status -D poolnamezpool get dedupratio poolname

相关内容