有什么办法可以找到类似的文件(不是重复的)吗?

有什么办法可以找到类似的文件(不是重复的)吗?

我的最终目标是重构同事编写的代码。那么,有没有一种工具可以找到只有几个词不同的文件?

(编辑:这是针对 Mac 的,但其他人可能也喜欢非 Mac 的答案。)

答案1

猿猴对某些语言的源代码执行此操作。它最擅长发现明显的复制粘贴代码。它的发展似乎停滞了,但它工作得还不错。

答案2

(适用于 Windows)

产品反双胞胎(私人使用免费)索赔能够做到这一点:

如果您希望 Anti-Twin 不仅搜索完整重复文件,还搜索相似文件,则可以将所需的最小匹配度从默认值 100% 降低到最多 60%。此功能专为搜索几乎完全相同的文件而设计,这些文件只更改了很小的细节。只要您输入低于 100% 的值,Anti-Twin 就会使用相似性搜索。相似性比较比 100% 完整重复搜索花费的时间要长得多!

不幸的是,相似性搜索作为逐字节比较的一部分仅对少数文件类型有意义,因为只有在文件未压缩且未加密的情况下才能检测到相似性。未压缩的文件例如未格式化的文本 (.TXT) 和 HTML。

相关内容