对 Bash 文件中 for 循环中使用的文件进行排序

Question

虽然我同意使用像md5sum和shasum这样的实用程序远的在检测重复项方面比文件大小更有效（如评论中所述），这个问题的根源似乎更多地是关于当名称中包含空格时如何对文件进行排序。我相信您可以使用它来做ls -S1您想要的事情，因为这将使输出的ls每个逻辑行都有一个文件名（按大小排序）。如果您将 IFS 变量更改为在换行符处中断，您应该会得到您想要的结果。下面是一些示例代码说明：

ORIG_IFS="${IFS}"
IFS=$'\n'
for CURR_FILE in $(ls -S1)
do
    echo "Next file: ${CURR_FILE}"

done

IFS="${ORIG_IFS}"

如果您选择使用md5sum或，shasum您将看到命令输出在每个输出行的开头打印哈希值，后跟文件名。然后，您可以sort输出（将重复的哈希值行放在一起），使用 cut 命令从行开头剥离固定长度的哈希值，并以类似于您尝试处理文件大小的方式进行处理。

Answer 1

虽然我同意使用像md5sum和shasum这样的实用程序远的在检测重复项方面比文件大小更有效（如评论中所述），这个问题的根源似乎更多地是关于当名称中包含空格时如何对文件进行排序。我相信您可以使用它来做ls -S1您想要的事情，因为这将使输出的ls每个逻辑行都有一个文件名（按大小排序）。如果您将 IFS 变量更改为在换行符处中断，您应该会得到您想要的结果。下面是一些示例代码说明：

ORIG_IFS="${IFS}"
IFS=$'\n'
for CURR_FILE in $(ls -S1)
do
    echo "Next file: ${CURR_FILE}"

done

IFS="${ORIG_IFS}"

如果您选择使用md5sum或，shasum您将看到命令输出在每个输出行的开头打印哈希值，后跟文件名。然后，您可以sort输出（将重复的哈希值行放在一起），使用 cut 命令从行开头剥离固定长度的哈希值，并以类似于您尝试处理文件大小的方式进行处理。

对 Bash 文件中 for 循环中使用的文件进行排序

答案1

相关内容