类似文件的最佳压缩?

类似文件的最佳压缩?

我有一些完整的旧备份,例如二进制数据库转储。显然,它们没有太大区别,因此进行完整备份并不是最明智的想法。目前,我正在寻找一个能够利用大多数文件具有相似内容这一事实的压缩程序。

答案1

如果您首先压缩文件(使用tar cvf my_backup.tar <file list...>),那么任何压缩工具都会做得很好,因为它们会将数据视为一个大文件。

因此,只需 tar 文件,然后将它们放入 zip、7-zip、bzip2 等格式中。从 tar 文件中,您可以尝试不同的压缩算法,看看哪一种效果最好。

答案2

我在 7-Zip 上运气很好。如果你有足够的马力,它能够在一个非常大的窗口下运行。确保您的原始文件尽可能未压缩,以便可以找到相似之处。 (例如,对于异构环境中的 Excel 文件,这意味着首先解压缩其内容,因为 xlsx 文件在存储时会被轻微压缩。我曾经能够将 600 MiB+ 的几乎冗余的 Excel 版本文件压缩到几个一百 KiB。)

相关内容