WinRAR 能检测重复文件吗?

WinRAR 能检测重复文件吗?

我有一个目录,里面有很多子目录,其中有很多重复文件。如果我将所有内容移动到一个 rar 存档中,WinRAR 会检测到重复文件吗?还是会将所有文件存档并加起来达到 rar 存档的大小?

答案1

WinRAR 5.00 的新版本引入了新的 RAR5 存档格式,此功能是其众多改进之一:

将相同文件保存为参考

如果启用此选项,WinRAR 会在开始压缩之前分析文件内容。如果发现多个大于 64 KB 的相同文件,则将集合中的第一个文件保存为普通文件,并将所有后续文件保存为对第一个文件的引用。它允许减小压缩文件大小,但对生成的压缩文件有一些限制。在创建压缩文件后,您不得删除或重命名压缩文件中的第一个相同文件,因为这将导致无法将其作为引用提取后续文件。如果您修改第一个文件,则提取后后续文件也将具有修改后的内容。提取命令必须涉及第一个文件才能成功创建后续文件。

建议仅当您压缩大量相同文件、以后不会修改档案并且将完全提取档案而不需要解压或跳过单个文件时才使用此选项。如果所有相同文件都足够小以适合压缩字典,则固实归档可以提供比此选项更灵活的解决方案。

仅支持 RAR 5.0 档案。

我对包含 320,000 个文件(带有大量模组的《博德之门三部曲》)的文件夹进行了快速测试:

RAR4 压缩方法,压缩设置为“存储”:26.1 GB(28,053,815,768 字节)

RAR5 压缩方法,压缩设置为“存储”并开启“将相同文件保存为参考”:23.9 GB (25,722,664,097 字节)

因此,我无需使用任何压缩就能够节省超过 9%!

答案2

如果文件确实是重复的(或接近重复的),压缩软件可以利用文件之间的相似性来大大提高压缩率。这称为实体压缩。WinRAR 和 7-Zip 是两个使用它的流行归档程序——7-Zip 默认使用它。我不是 RAR 用户,所以我不能告诉你它的默认配置。

Linux/Unix/BSD 系统上的常见归档程序也会隐式地执行固实压缩,即先将所有文件连接成一个文件(通常通过tar),然后再将该单个文件压缩为一个大块。

所有这些的一个巨大警告是,您实际上无法确切知道哪些文件是相似的,或者它们有多相似。这不是找出您拥有的重复文件的好方法,提取存档将恢复所有重复文件。这通常正是人们通过数据压缩所希望和期望的——准确地恢复放入其中的内容。

如果您想清理文件夹,您需要重复检测软件。对于普通收藏,有大量软件可以找出重复文件。如果您处理的是媒体(音频、视频、图片),那么您将需要一款不搜索完全重复文件,但可以对您的文件进行指纹识别并找到相似文件组的软件。这样,如果您有 2 份同一首歌曲的副本,但标签不同或压缩方式略有不同(例如,128 Kb/s MP3 和 256 Kb/s AAC),它们就可以被识别。或者识别 2 幅同一主题的图片,其中一张已被裁剪或编辑。每种媒体类型通常都有专门用于查找相似文件的软件,在处理每种类型的细节之前,这里已经存在一些问题。当然,清理此类收藏要困难得多,而且耗时得多,因为没有快速简便的规则来决定应该保留哪个文件。

答案3

WinRAR 不会满足您的要求。但是,还有其他工具可以查找文件夹或分区内的重复文件。我以前也需要这样做,我用的是轻松查找重复项软件:

Easy Duplicate Finder 是一款功能强大的工具,可查找和解决重复的照片、文档、电子表格、MP3 等!删除重复项还有助于加快索引速度并减少备份大小和时间。除非您删除了所有不必要的重复文件,否则您的计算机尚未完全优化。让 Easy Duplicate Finder 删除重复项吧!

答案4

压缩复制文件相似/不同文件名,在 Winrar 5 中使用这两个选项

  1. 创建固体档案

固实存档是一种使用特殊压缩方法打包的存档,它将存档中的多个或所有文件视为一个连续的数据流。WinRAR 仅在 RAR 存档格式中支持固实模式,ZIP 存档始终是非固实的。在添加大量小型相似文件时,固实存档可显著提高压缩率。

  1. 将相同文件保存为参考

WinRAR 在开始压缩之前会分析文件内容。如果发现多个相同的文件,则将文件中的第一个文件保存为普通文件,并将所有后续文件保存为对第一个文件的引用。这可以减少压缩文件的大小,但会对生成的压缩文件施加一些限制。在创建压缩文件后,您不得删除或重命名压缩文件中的第一个相同文件,因为这将导致无法将其作为引用提取后续文件。如果您修改第一个文件,则提取后后续文件也将具有修改后的内容。提取命令必须涉及第一个文件才能成功创建后续文件。

仅当您压缩大量相同的文件、以后不会修改档案并且将完全提取档案而不需要解压或跳过单个文件时,才建议使用“保存相同文件作为参考”。

创建新的 .rar 档案时,设置位于以下位置:

  1. 创建 Solid Archive 的位置
  2. 将相同文件保存为参考的位置

相关内容