在 Linux 中删除非重复的行

Question 1

其他人发布的解决方案不适用于我的 Debian Jessie：他们保留了一个单身的复制任何重复的行，而根据我对 OP 的理解全部重复行的副本应保留。如果我理解正确的话，那么...

以下命令
```
awk '!seen[$0]++' file
```
删除所有重复的行。
以下命令
```
awk 'seen[$0]++' file 
```
输出所有重复项，但不输出原始副本：IE，如果出现一条线n次，它输出行n-1次。
然后命令
```
awk 'seen[$0]++' file > temp && awk '!seen[$0]++' file >> temp
```
解决了您的问题。这些行不是按原始顺序排列的。
如果您想要有两个或更多重复项的行，您现在可以迭代上述操作：
```
awk 'seen[$0]++' file | awk 'seen[$0]++' > temp
```
保持n-2复制了n>1重复。现在
```
awk '!seen[$0]++' temp > temp1 
```
从临时文件中删除所有重复的行，现在您就可以获得您想要的内容（IE只有n>1重复项）如下：
```
cat temp1 >> temp; cat temp1 >> temp
```
如果需要对出现的行执行此操作否或更多次，以下命令
```
  awk 'seen[$0]++ && seen[$0] > N' file 
```
比链接更简单否次命令awk 'seen[$0]++' file。

Answer

其他人发布的解决方案不适用于我的 Debian Jessie：他们保留了一个单身的复制任何重复的行，而根据我对 OP 的理解全部重复行的副本应保留。如果我理解正确的话，那么...

以下命令
```
awk '!seen[$0]++' file
```
删除所有重复的行。
以下命令
```
awk 'seen[$0]++' file 
```
输出所有重复项，但不输出原始副本：IE，如果出现一条线n次，它输出行n-1次。
然后命令
```
awk 'seen[$0]++' file > temp && awk '!seen[$0]++' file >> temp
```
解决了您的问题。这些行不是按原始顺序排列的。
如果您想要有两个或更多重复项的行，您现在可以迭代上述操作：
```
awk 'seen[$0]++' file | awk 'seen[$0]++' > temp
```
保持n-2复制了n>1重复。现在
```
awk '!seen[$0]++' temp > temp1 
```
从临时文件中删除所有重复的行，现在您就可以获得您想要的内容（IE只有n>1重复项）如下：
```
cat temp1 >> temp; cat temp1 >> temp
```
如果需要对出现的行执行此操作否或更多次，以下命令
```
  awk 'seen[$0]++ && seen[$0] > N' file 
```
比链接更简单否次命令awk 'seen[$0]++' file。

Question 2

您可以使用sort&uniq命令来实现这一点。

如果您的数据在 abc.txt 文件中，那么；

cat abc.txt |sort|uniq -d

输出将是；

abc 
bbc

Answer

您可以使用sort&uniq命令来实现这一点。

如果您的数据在 abc.txt 文件中，那么；

cat abc.txt |sort|uniq -d

输出将是；

abc 
bbc

Question 3

@UUU 的答案没有保持排序顺序。要保持排序顺序，请改用以下内容：

 printf '%s\n' abc bbc abc bbc ccc bbc | \
     nl -nrz     | \
     sort -k2    | \
     uniq -f1 -D | \
     sort        | \
     cut -f2

Answer

@UUU 的答案没有保持排序顺序。要保持排序顺序，请改用以下内容：

 printf '%s\n' abc bbc abc bbc ccc bbc | \
     nl -nrz     | \
     sort -k2    | \
     uniq -f1 -D | \
     sort        | \
     cut -f2

相关内容