对多个文件进行批量排序并从多个文件中删除重复行 - 如果可能的话就地进行

Question

我不确定单个命令的要求是什么，但这非常接近：

(cd /directory/; find -type f -printf '%P\0' | while IFS= read -r -d '' fn; do
    awk '{ print length, $0 }' "$fn" | sort -nur | sed -r 's/^[0-9]+ //' > "$fn.~"
    mv "$fn.~" "$fn"
done)

第一行只是以尽可能稳健的方式读取文件名。

第二行是所有工作发生的地方：

awk 在每行的开头添加字符数（+ 空格）
sort -n（数字）、-u（唯一）和 -r（反向）处理文件
sed 删除前导字符计数
然后它被转储到临时文件

然后 mv 行将临时文件写入原始文件（因为在管道期间无法完成）。

Answer 1

我不确定单个命令的要求是什么，但这非常接近：

(cd /directory/; find -type f -printf '%P\0' | while IFS= read -r -d '' fn; do
    awk '{ print length, $0 }' "$fn" | sort -nur | sed -r 's/^[0-9]+ //' > "$fn.~"
    mv "$fn.~" "$fn"
done)

第一行只是以尽可能稳健的方式读取文件名。

第二行是所有工作发生的地方：

awk 在每行的开头添加字符数（+ 空格）
sort -n（数字）、-u（唯一）和 -r（反向）处理文件
sed 删除前导字符计数
然后它被转储到临时文件

然后 mv 行将临时文件写入原始文件（因为在管道期间无法完成）。

对多个文件进行批量排序并从多个文件中删除重复行 - 如果可能的话就地进行

答案1

相关内容