当没有差异时删除文件

Question 1

你可以这样做：

for file in /path/to/dirA/*; do
    fileName=${file##*/}
    diff -q <(sort "$file") <(sort /path/to/dirB/"$fileName") && 
    rm /path/to/dirB/"$fileName"
done

这将迭代中的所有文件dirA，将每个文件保存为$file.请注意，$file将包括路径，因此它将是/path/to/dirA/file1而不仅仅是file1.这就是为什么我们需要获取文件名，我们通过删除最后一个斜杠 ( fileName=${file##*/}) 之前的所有内容来实现。然后，我们默默地将该文件与目录 B 中的同名文件进行比较，如果它们相同，那么如果diff成功退出，我们将从目录 B 中删除该文件。这&&意味着“仅当该命令是时才运行下一个命令”成功”，因此rm仅当文件相同时才会运行。

要使其递归，假设您正在使用bash，请使用：

shopt -s globstar
cd /path/to/dirA/
for file in **; do
    fileName=${file#*/}
    echo diff -q <(sort "$file") <(sort /path/to/dirB/"$fileName") && 
    rm /path/to/dirB/"$fileName"
done

或者，更复杂一点，跳过目录和不存在的文件：

shopt -s globstar
cd /path/to/dirA/
for file in **; do
    if [ -d "$file" ]; then 
        echo "$file is a directory, skipping."; 
    else
        fileName=${file#*/}
        if [[ -e /path/to/dirB/"$fileName" ]]; then
            echo diff -q <(sort "$file") <(sort /path/to/dirB/"$fileName") && 
            rm /path/to/dirB/"$fileName"
        fi
    fi
done

Answer

你可以这样做：

for file in /path/to/dirA/*; do
    fileName=${file##*/}
    diff -q <(sort "$file") <(sort /path/to/dirB/"$fileName") && 
    rm /path/to/dirB/"$fileName"
done

这将迭代中的所有文件dirA，将每个文件保存为$file.请注意，$file将包括路径，因此它将是/path/to/dirA/file1而不仅仅是file1.这就是为什么我们需要获取文件名，我们通过删除最后一个斜杠 ( fileName=${file##*/}) 之前的所有内容来实现。然后，我们默默地将该文件与目录 B 中的同名文件进行比较，如果它们相同，那么如果diff成功退出，我们将从目录 B 中删除该文件。这&&意味着“仅当该命令是时才运行下一个命令”成功”，因此rm仅当文件相同时才会运行。

要使其递归，假设您正在使用bash，请使用：

shopt -s globstar
cd /path/to/dirA/
for file in **; do
    fileName=${file#*/}
    echo diff -q <(sort "$file") <(sort /path/to/dirB/"$fileName") && 
    rm /path/to/dirB/"$fileName"
done

或者，更复杂一点，跳过目录和不存在的文件：

shopt -s globstar
cd /path/to/dirA/
for file in **; do
    if [ -d "$file" ]; then 
        echo "$file is a directory, skipping."; 
    else
        fileName=${file#*/}
        if [[ -e /path/to/dirB/"$fileName" ]]; then
            echo diff -q <(sort "$file") <(sort /path/to/dirB/"$fileName") && 
            rm /path/to/dirB/"$fileName"
        fi
    fi
done

Question 2

使用诸如之类的工具fdupes，该工具专门用于通过计算每个文件的 md5 哈希值来实现此目的。我不会在这里向您提供具体细节，因为有一些警告，例如如果您指定同一目录两次，则会丢失数据。例如，如果您指定/home/和~/ 同时，您的主目录中的文件将被列为它们自己的重复项。如果您将 fdupes 设置为自动删除重复项，您最终将删除主目录中的所有文件！

也许您能做的最有用的事情就是man fdupes在 CLI 中输入，它将向您显示包含所有选项的手册，这样您就可以自己找到使用它的最佳方法是什么，以及您想要使用哪些选项或不是。这些警告并不是可怕的事情，而是需要注意的事情，这可能是训练自己使用此类工具的最佳方法，因为您会更好地理解它的作用。如果您“盲目”复制粘贴答案中给出的建议，您将不会获得这种优势。

如果您没有可用的工具，您的发行版很可能会在存储库中提供它，因为它是许多人选择的命令行工具。

或者，您可能想考虑fslint，这显然是一个有用的基于 GUI 的工具。我自己从未尝试过，所以不能说太多。

Answer

使用诸如之类的工具fdupes，该工具专门用于通过计算每个文件的 md5 哈希值来实现此目的。我不会在这里向您提供具体细节，因为有一些警告，例如如果您指定同一目录两次，则会丢失数据。例如，如果您指定/home/和~/ 同时，您的主目录中的文件将被列为它们自己的重复项。如果您将 fdupes 设置为自动删除重复项，您最终将删除主目录中的所有文件！

也许您能做的最有用的事情就是man fdupes在 CLI 中输入，它将向您显示包含所有选项的手册，这样您就可以自己找到使用它的最佳方法是什么，以及您想要使用哪些选项或不是。这些警告并不是可怕的事情，而是需要注意的事情，这可能是训练自己使用此类工具的最佳方法，因为您会更好地理解它的作用。如果您“盲目”复制粘贴答案中给出的建议，您将不会获得这种优势。

如果您没有可用的工具，您的发行版很可能会在存储库中提供它，因为它是许多人选择的命令行工具。

或者，您可能想考虑fslint，这显然是一个有用的基于 GUI 的工具。我自己从未尝试过，所以不能说太多。

当没有差异时删除文件

答案1

答案2

相关内容