对于许多相同的文件来说有更有效的文件压缩程序吗?

对于许多相同的文件来说有更有效的文件压缩程序吗?

我正在备份我的工作,正在寻找一个可以更有效地压缩文件的程序。Windows 默认压缩程序运行良好,但它不像我希望的那样“智能”。

我的文件基本上是我过去几个月进行定期完整备份时拍摄的完整快照。备份之间没有太多变化,许多文件只是彼此的副本。

我的整个文件集未压缩时大约有 15GB,而单个快照备份(使用标准压缩程序压缩)每个大约有 150 到 200 MB(通常随着日期的推移,大小会增加)。所有压缩快照的总大小约为 3GB。由于文件的性质,我预计“智能”压缩程序会将整个卷压缩到大约 400-500 MB,也就是说,考虑到合理的低效率和额外的空间来压缩文件中的差异。

是否有一个压缩程序可以利用许多文件相同的事实来实现比标准 Windows 压缩程序高得多的压缩率?

谢谢 -Faken

编辑:刚刚使用标准 Windows 压缩对整个卷进行了最佳压缩。它只比压缩快照的总和好 10MB。在我看来,考虑到文件的性质,这是不可接受的。

答案1

7-zip如果我没记错的话,它支持固实压缩,因此它应该可以很好地压缩许多几乎相同的文件。

答案2

我使用 7-zip(版本 9.20)对问题中提到的“相同文件”方面进行了一些测试,因为目前还没有人对此给出详细的答案。这得到了一些有趣的结果。我测试了 10 个此网站用于显示页面未找到消息的文件。由于是 jpg 文件,因此作为单个文件压缩效果不佳。因此,它将展示压缩多个相同文件的效率。其文件大小为 37 KB。

  1. 当我使用 zip 格式压缩所有十份副本时,文件大小为 367 KB,压缩后大小约为原始总大小的 99%共 10文件。
  2. 当我使用 7z 格式压缩所有十份副本时,文件大小为 37 KB,压缩后大小约为只有一个原始文件。
  3. 如果我首先将 5 个副本放入 7-z 档案中,然后分步添加 3 个副本并最终添加 2 个副本,则文件大小将变为 111 KB,大约是单个原始文件大小的三倍。

如果我打开第三个档案,其中一个属性是堵塞。这分别列出了文件 3、5 和 2 的 0、1 和 2。

观察结果:

  1. zip 格式将单独压缩每个文件,无法有效压缩相同的文件。
  2. 7z 格式将有效地压缩多个相同的文件,只要将它们一次性添加到档案中即可。

结论:

  1. 为了对文件进行最佳压缩,请使用 7z 而不是 zip。
  2. 如果不将文件添加到现有的 7z 存档,而是先将其解压缩,然后再压缩(包括新文件),则压缩率可能会显著提高。

答案3

Windows Vista 自带备份和恢复中心。它将对您的文件进行增量备份,以避免浪费空间并必须创建多个备份。来自链接页面:

以前备份的文件版本仅占用最少的磁盘空间。如果文件只有一小部分发生变化(例如演示文稿中的一张幻灯片),则只会跟踪和保存这一部分。

答案4

7-zip拥有最好的压缩算法之一。我认为目前还没有任何东西可以在压缩(算法)方面胜过 7-zip。

相关内容