在 Unix 命令行上获取两个文本文件的补集

在 Unix 命令行上获取两个文本文件的补集

是否存在一个快速的基于 Unix 的实用程序(最好用 C 编写)用于获得制表符分隔文本文件的高效、流式交集/并集?

例如,允许这样的查询“给我文件 A 中具有列值 K 的所有条目,这些条目未出现在文件 B 的任何列 K 中”。

例如,如果文件 A 是:

bob sally sue
bob mary john

文件 B 为:

john sally sue
foo bar quux

那么文件 A 相对于文件 B 在第 2 列的补码将返回“bob mary john”,因为这是文件 B 中唯一在第 2 列中具有未在文件 B 中出现的值。

我不太喜欢使用数据库,但我想要一个基于命令行的实用程序。大王答案还是有更简单的答案?

相关内容