是否存在一个快速的基于 Unix 的实用程序(最好用 C 编写)用于获得制表符分隔文本文件的高效、流式交集/并集?
例如,允许这样的查询“给我文件 A 中具有列值 K 的所有条目,这些条目未出现在文件 B 的任何列 K 中”。
例如,如果文件 A 是:
bob sally sue
bob mary john
文件 B 为:
john sally sue
foo bar quux
那么文件 A 相对于文件 B 在第 2 列的补码将返回“bob mary john”,因为这是文件 B 中唯一在第 2 列中具有未在文件 B 中出现的值。
我不太喜欢使用数据库,但我想要一个基于命令行的实用程序。大王答案还是有更简单的答案?