打印所有具有重复字段的行的最有效方法是什么？

Question

这会改变输出的顺序，但只需要读取文件一次：

$ awk -F'|' '$2 in a{if(a[$2])print a[$2];a[$2]=""; print; next} {a[$2]=$0}' fruit_notes.txt
banana|YELLOW|My turtle likes these.
grapefruit|YELLOW|Very juicy
lemon|YELLOW|Sour!
cherry|RED|Sweet and tasty
apple|RED|Makes great pie

怎么运行的：

$2 in a{if(a[$2])print a[$2];a[$2]=""; print; next}

如果$2是关联数组中的键a，则（a）如果a[$2]不为空，则打印它，（b）设置a[$2]为空，（c）打印当前行，（d）跳过其余命令并从下一行重新开始。
a[$2]=$0

如果这是我们第一次遇到$2，请将当前行保存在a键下$2。

Answer 1

这会改变输出的顺序，但只需要读取文件一次：

$ awk -F'|' '$2 in a{if(a[$2])print a[$2];a[$2]=""; print; next} {a[$2]=$0}' fruit_notes.txt
banana|YELLOW|My turtle likes these.
grapefruit|YELLOW|Very juicy
lemon|YELLOW|Sour!
cherry|RED|Sweet and tasty
apple|RED|Makes great pie

怎么运行的：

$2 in a{if(a[$2])print a[$2];a[$2]=""; print; next}

如果$2是关联数组中的键a，则（a）如果a[$2]不为空，则打印它，（b）设置a[$2]为空，（c）打印当前行，（d）跳过其余命令并从下一行重新开始。
a[$2]=$0

如果这是我们第一次遇到$2，请将当前行保存在a键下$2。

打印所有具有重复字段的行的最有效方法是什么？

答案1

相关内容