可以使用 uniq 删除一行重复内容而保留另一行吗？

Question 1

带有数字和两行空白行的示例：

$ cat unsorted

1
2
3
1
2
3
4
3
2
1

$ sort unsorted


1
1
1
2
2
2
3
3
3
4
$ sort unsorted | uniq

1
2
3
4

Answer

带有数字和两行空白行的示例：

$ cat unsorted

1
2
3
1
2
3
4
3
2
1

$ sort unsorted


1
1
1
2
2
2
3
3
3
4
$ sort unsorted | uniq

1
2
3
4

Question 2

如果你只想输出第一的每行出现次数无需排序，使用awk或perl维护哈希（关联数组）

awk '!a[$0]++' file

或者

perl -ne 'print unless $h{$_}++' file

如果你想保留最后的发生，然后做同样的事情，但是向后读取文件并在之后将其反转：

tac file | awk '!a[$0]++' | tac

对于更复杂的删除操作（例如删除除第二个之外的所有内容多种的重复，同时打印所有非重复的行）我认为您需要处理该文件两次。

Answer

如果你只想输出第一的每行出现次数无需排序，使用awk或perl维护哈希（关联数组）

awk '!a[$0]++' file

或者

perl -ne 'print unless $h{$_}++' file

如果你想保留最后的发生，然后做同样的事情，但是向后读取文件并在之后将其反转：

tac file | awk '!a[$0]++' | tac

对于更复杂的删除操作（例如删除除第二个之外的所有内容多种的重复，同时打印所有非重复的行）我认为您需要处理该文件两次。

相关内容