根据校验和递归区分两个目录？

Question

我会为两个树生成一个 md5sum 列表（一列表示总和，一列表示文件名），并将结果通过管道传输到一个脚本（例如 awk 或 perl）中，该脚本可以使用总和作为文件名的哈希值，并使脚本报告具有相同哈希值的文件名。

这不仅仅是一句简单的话，而且是经常被问到、经常被解决的问题（按内容搜索重复文件的结果超过一百万次）。

您可能会发现这很有帮助：

Answer 1

我会为两个树生成一个 md5sum 列表（一列表示总和，一列表示文件名），并将结果通过管道传输到一个脚本（例如 awk 或 perl）中，该脚本可以使用总和作为文件名的哈希值，并使脚本报告具有相同哈希值的文件名。

这不仅仅是一句简单的话，而且是经常被问到、经常被解决的问题（按内容搜索重复文件的结果超过一百万次）。

您可能会发现这很有帮助：

测试用例