每个系统管理员都知道,rsync
如果您需要备份大型文件(例如数据库文件),那么这就是要走的路:由于它使用增量压缩,它只会覆盖从原始文件修改到备份文件的块,从而避免了大量的开销。
然而,对于某些文件格式,例如gzip
和bzip2
,修改文件会导致整个块被再次复制,因为它会导致某种蝴蝶效应在修改它的文件结构中,即使只改变几个字节。
那么,哪种压缩文件格式最rsync
友好?相反,当时间紧迫且必须备份 10K 数据时,是否还有其他格式必须避免使用?
答案1
您是否知道最新版本gzip
有一个--rsyncable
选项?摘自手册页:
压缩时,偶尔会根据输入同步输出。大多数情况下,这会使大小增加不到 1%,但这意味着 rsync(1) 程序在同步使用此标志压缩的两个文件时可以利用未压缩输入中的相似性。 gunzip 无法区分使用此选项创建的压缩文件和未使用此选项创建的压缩文件。