删除不在同一行的重复值

Question 1

如果您不坚持使用sort/uniq那么：

$ awk '!seen[$2]++' file
RR0.out -1752.142111    
RR1.out -1752.141887    
RR3.out -1752.140319    
RR4.out -1752.140564    
RR5.out -1752.138532    
RR6.out -1752.138493

（它与您的预期输出不同RR5.out -1752.138532，因为RR8.out -1752.138532仅尾随空格不同；awk将其视为分隔符的一部分，而不是第二个字段的一部分。）

Answer

如果您不坚持使用sort/uniq那么：

$ awk '!seen[$2]++' file
RR0.out -1752.142111    
RR1.out -1752.141887    
RR3.out -1752.140319    
RR4.out -1752.140564    
RR5.out -1752.138532    
RR6.out -1752.138493

（它与您的预期输出不同RR5.out -1752.138532，因为RR8.out -1752.138532仅尾随空格不同；awk将其视为分隔符的一部分，而不是第二个字段的一部分。）

Question 2

$ sort -uk2 file
RR6.out -1752.138493
RR8.out -1752.138532
RR5.out -1752.138532
RR3.out -1752.140319
RR4.out -1752.140564
RR1.out -1752.141887
RR0.out -1752.142111

sort -u对输出进行排序并仅生成唯一值，-k2将根据第二列进行排序/唯一。

为了根据第一列中的文件名对输出重新排序，您可以将其重新排序：

$ sort -uk2 file | sort -k1
RR0.out -1752.142111
RR1.out -1752.141887
RR3.out -1752.140319
RR4.out -1752.140564
RR5.out -1752.138532
RR6.out -1752.138493
RR8.out -1752.138532

Answer

$ sort -uk2 file
RR6.out -1752.138493
RR8.out -1752.138532
RR5.out -1752.138532
RR3.out -1752.140319
RR4.out -1752.140564
RR1.out -1752.141887
RR0.out -1752.142111

sort -u对输出进行排序并仅生成唯一值，-k2将根据第二列进行排序/唯一。

为了根据第一列中的文件名对输出重新排序，您可以将其重新排序：

$ sort -uk2 file | sort -k1
RR0.out -1752.142111
RR1.out -1752.141887
RR3.out -1752.140319
RR4.out -1752.140564
RR5.out -1752.138532
RR6.out -1752.138493
RR8.out -1752.138532

删除不在同一行的重复值

答案1

答案2

相关内容