有一个很棒的工具,fdupes,用于在两个(或更多)目录中查找重复的文件。
我正在寻找一个可以输出互补集(没有重复的文件的路径)的简单工具/命令。
答案1
find DIR1 DIR2 -type f -exec sha1sum '{}' \+ | sort | \
uniq -c --check-chars 40 | egrep '^ *1 ' | cut -c 51-
答案2
答案3
答案4
我曾经在查找这些唯一文件时遇到过同样的问题,并且我不想对它们进行校验(因为它们太大而且太多),所以我根据文件名和文件大小编写了一个脚本:
isolated-files.py --source folder1 --target folder2
这将显示文件夹 2 中所有不在文件夹 1 中的文件(也是递归的)。它也可以用于 SSH 连接和多个文件夹。