检测 Windows 上的 7-Zip 档案中的图像重复项?

检测 Windows 上的 7-Zip 档案中的图像重复项?

我有一个大型图库,几年后我意识到我得到的重复图片越来越多。:) 基本上,我的图库由包含图片集的 7-Zip 存档组成。我看到有一些适用于 Windows 的商业图像重复扫描程序,但不幸的是,它们只处理 RAR 和 ZIP 格式。

因此,我想找到一种可以扫描常规目录和此类档案的工具,就像它们是常规目录一样。(也许,如果可能的话,可以有某种虚拟文件系统挂载,可以制作类似文件系统镜像的东西,其中所有档案都扩展为常规文件。)目标系统是 Windows,尽管 Cygwin 相关的想法也非常受欢迎。

有人能帮忙吗?非常感谢您的帮助。

答案1

我不知道有什么工具可以做到这一点,但如果你有兴趣自己尝试一种实现这一目标的方法,那就是编写一个脚本,包装7z l -slt archive.7z每个文件并将其附加到一个文件中:

  • 文件的名称
  • 文件的大小
  • 其 CRC

从这里您只需找到重复项(定义为“相等的 CRC 和大小”以限制冲突)并使用删除它们7z d archive.7z filename

编辑:

你可能想看看这个项目,尽管它还不支持写入,但它可以发展:
fuse-7z

对于其他存档格式,还有许多其他解决方案,下面是列表: http://sourceforge.net/apps/mediawiki/fuse/index.php?title=ArchiveFileSystems

相关内容