我偶然发现了一个愚蠢的使用案例。我想以特定的方式合并两个文件夹(我猜现在它们被称为文件夹,我仍然将它们视为目录,但无论如何)。文件夹具有以下特征:
- 内容大体相同(但各有各的独特内容)
- 文件夹结构大致相同
- 文件夹 A 中某些相同内容的文件修改日期较早
- 文件夹 B 中的一些非相同内容具有较新的文件修改日期
我要做的是合并文件夹 A 和文件夹 B,使得其中至少有一个满足以下条件:
- 包含之前在 A 和 B 中的所有文件
- 具有 A 或 B 中的所有文件夹结构
- 对于相同的文件,具有较早修改日期的文件版本
- 对于不相同的文件,具有较新修改日期的文件版本
这些文件夹非常大。我花了 24 小时试图编写一个脚本(在 R 中,因为当你只有一把锤子时,所有东西看起来都像钉子),该脚本可以使用 CloneSpy 的文本输出并从 R 的文件查询函数中获取文件修改日期来实现这一点……但该解决方案很慢,我无法将任何东西拼凑在一起。我承认我的用例很奇怪,但它似乎并不完全独特。有什么想法可以更简单地做到这一点吗?
答案1
如果它是基于文本的文件,并且您不仅要查找重复项,还要删除近似重复项,则可以尝试http://www.softcorporation.com/products/neardup/它基于 Java,因此应该可以在 Windows 下运行。我猜它可以创建一份报告,说明哪些文件是重复的,然后您可以处理该报告并删除旧文件。