我有两个文件,每个文件都有 50 万多个用户帐户。我需要找到两者之间的差异(缺失的帐户/增量)。每个文件都采用简单的格式,每个文件中的每一行都包含一个电子邮件地址。
我已按独特性和字母顺序排序。现在需要找到delta。无法弄清楚如何在 Linux (Red Hat) 中执行此操作。一切都想逐行比较。
在file1
:
[email protected]
[email protected]
[email protected]
[email protected]
50万个账户。在file2
:
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
超过 30 万个帐户。等等等等
答案1
正如评论中提到的,您所要求的正是comm
做。运行以查看 中 中不存在的comm -32 file1 file2
行,或者查看 中 中不存在的行,或者查看仅存在于其中一个文件中的行,其中这些行是通过制表符缩进的。file1
file2
comm -31 file1 file2
file2
file1
comm -3 file1 file2
file2
请注意,comm
需要对其输入进行排序。如果您已经对文件进行排序,请确保它们已排序在同一语言环境中。