比较两个文件中的独立行

比较两个文件中的独立行

我有两个文件,每个文件都有 50 万多个用户帐户。我需要找到两者之间的差异(缺失的帐户/增量)。每个文件都采用简单的格式,每个文件中的每一行都包含一个电子邮件地址。

我已按独特性和字母顺序排序。现在需要找到delta。无法弄清楚如何在 Linux (Red Hat) 中执行此操作。一切都想逐行比较。

file1

[email protected]
[email protected]
[email protected]
[email protected]

50万个账户。在file2

[email protected]
[email protected]
[email protected]
[email protected]
[email protected]

超过 30 万个帐户。等等等等

答案1

正如评论中提到的,您所要求的正是comm做。运行以查看 中 中不存在的comm -32 file1 file2行,或者查看 中 中不存在的行,或者查看仅存在于其中一个文件中的行,其中这些行是通过制表符缩进的。file1file2comm -31 file1 file2file2file1comm -3 file1 file2file2

请注意,comm需要对其输入进行排序。如果您已经对文件进行排序,请确保它们已排序在同一语言环境中

相关内容