如何在第一列中找到重复项，然后删除相关的整行？

Question 1

要根据单个列删除重复项，您可以使用awk：

awk '!seen[$1]++' input-file > output-file

删除较旧的行更加复杂。考虑到重复项总是会聚在一起，您可以执行以下操作：

awk 'prev && ($1 != prev) {print seen[prev]} {seen[$1] = $0; prev = $1} END {print seen[$1]}' input-file > output-file

这里，在中间的块中，{seen[$1] = $0}将当前行（$0）保存到seen以第一个字段（$1）为索引的数组中，然后将第一个字段保存在变量中prev。这prev在第一个块中处理下一行时使用。

然后，在第一个块中，我们检查是否prev设置了（仅对于第二行及以后的行才为真）并且不等于当前的第一个字段（此处prev是在处理上一行时设置的）。如果不是，则我们已经跳过了重复项并可以打印上一行。在处END，我们对最后一行再次执行此操作。

Answer

要根据单个列删除重复项，您可以使用awk：

awk '!seen[$1]++' input-file > output-file

删除较旧的行更加复杂。考虑到重复项总是会聚在一起，您可以执行以下操作：

awk 'prev && ($1 != prev) {print seen[prev]} {seen[$1] = $0; prev = $1} END {print seen[$1]}' input-file > output-file

这里，在中间的块中，{seen[$1] = $0}将当前行（$0）保存到seen以第一个字段（$1）为索引的数组中，然后将第一个字段保存在变量中prev。这prev在第一个块中处理下一行时使用。

然后，在第一个块中，我们检查是否prev设置了（仅对于第二行及以后的行才为真）并且不等于当前的第一个字段（此处prev是在处理上一行时设置的）。如果不是，则我们已经跳过了重复项并可以打印上一行。在处END，我们对最后一行再次执行此操作。

Question 2

使用 tac 和 uniq。

$ tac text.txt | uniq -w 16 | tac

Answer

使用 tac 和 uniq。

$ tac text.txt | uniq -w 16 | tac

相关内容