合并两组文件的最佳方法是什么,但对于重复的文件,在 Windows 中选择较旧的文件?

合并两组文件的最佳方法是什么,但对于重复的文件,在 Windows 中选择较旧的文件?

我偶然发现了一个愚蠢的使用案例。我想以特定的方式合并两个文件夹(我猜现在它们被称为文件夹,我仍然将它们视为目录,但无论如何)。文件夹具有以下特征:

  • 内容大体相同(但各有各的独特内容)
  • 文件夹结构大致相同
  • 文件夹 A 中某些相同内容的文件修改日期较早
  • 文件夹 B 中的一些非相同内容具有较新的文件修改日期

我要做的是合并文件夹 A 和文件夹 B,使得其中至少有一个满足以下条件:

  • 包含之前在 A 和 B 中的所有文件
  • 具有 A 或 B 中的所有文件夹结构
  • 对于相同的文件,具有较早修改日期的文件版本
  • 对于不相同的文件,具有较新修改日期的文件版本

这些文件夹非常大。我花了 24 小时试图编写一个脚本(在 R 中,因为当你只有一把锤子时,所有东西看起来都像钉子),该脚本可以使用 CloneSpy 的文本输出并从 R 的文件查询函数中获取文件修改日期来实现这一点……但该解决方案很慢,我无法将任何东西拼凑在一起。我承认我的用例很奇怪,但它似乎并不完全独特。有什么想法可以更简单地做到这一点吗?

答案1

如果它是基于文本的文件,并且您不仅要查找重复项,还要删除近似重复项,则可以尝试http://www.softcorporation.com/products/neardup/它基于 Java,因此应该可以在 Windows 下运行。我猜它可以创建一份报告,说明哪些文件是重复的,然后您可以处理该报告并删除旧文件。

相关内容