如何对文件大小略有不同的相同照片进行重复数据删除?

如何对文件大小略有不同的相同照片进行重复数据删除?

我使用 Dropbox 的新“相机导入”功能导入了许多照片。其中许多照片都是之前直接从相机复制导入的照片的副本。

奇怪的是,Dropbox 导入似乎略有减少文件大小。

例如右边是通过 Dropbox 导入的文件: 在此处输入图片描述

使用以下方法比较两个文件差分返回“图像是二进制相同的”,但诸如 fdupes 或甚至 Picasa 的“显示重复文件”功能之类的工具将它们视为唯一的。

导致文件大小变化的原因是什么? 有没有什么方法可以消除它?

最重要的是:如何才能在不考虑文件大小比较的情况下有效地进行重复数据删除?(对我的库中的所有照片对运行 pdiff 比较显然是不切实际的......)

适用于 OS X 或 Windows 的解决方案均可。

答案1

我最近也不得不进行类似的修剪。DupeGuru(PE 版)在查找重复文件和类似文件方面非常出色。我能够删除几 GB 的重复文件,而这些文件是无法手动确定和处理的。祝你好运!

相关内容