2 大型文本文件，查找不重复的行 linux 终端

Question

如果文件排序很好，您可以做一些同样简单的事情。

diff -u file1 file2

如果文件未排序，而您想找到唯一的行，您可以执行类似的操作。

diff -u <(sort file1) <(sort file2)

鉴于您的上述文件，您将会看到这一点。

$ diff -u <(sort file1) <(sort file2)
--- /dev/fd/63  2014-09-19 15:40:20.223409721 -0700
+++ /dev/fd/62  2014-09-19 15:40:20.219409761 -0700
@@ -1,4 +1,5 @@
-cats 3
+bird 6
+cats 78
 dogs 8
 mice 4
-pigs 10
+pigs 29

有没有办法只获取“+”输出而不是所有“-”线等，

当然，只需通过 grep 将其堆叠即可。

$ diff -u <(sort file1) <(sort file2) | grep '^+'
+++ /dev/fd/62  2014-09-19 15:50:18.293474221 -0700
+bird 6
+cats 78
+pigs 29

Answer 1

如果文件排序很好，您可以做一些同样简单的事情。

diff -u file1 file2

如果文件未排序，而您想找到唯一的行，您可以执行类似的操作。

diff -u <(sort file1) <(sort file2)

鉴于您的上述文件，您将会看到这一点。

$ diff -u <(sort file1) <(sort file2)
--- /dev/fd/63  2014-09-19 15:40:20.223409721 -0700
+++ /dev/fd/62  2014-09-19 15:40:20.219409761 -0700
@@ -1,4 +1,5 @@
-cats 3
+bird 6
+cats 78
 dogs 8
 mice 4
-pigs 10
+pigs 29

有没有办法只获取“+”输出而不是所有“-”线等，

当然，只需通过 grep 将其堆叠即可。

$ diff -u <(sort file1) <(sort file2) | grep '^+'
+++ /dev/fd/62  2014-09-19 15:50:18.293474221 -0700
+bird 6
+cats 78
+pigs 29

2 大型文本文件，查找不重复的行 linux 终端

答案1

相关内容