减去两个文件中共同的文本字符串的方法?

减去两个文件中共同的文本字符串的方法?

我有两个文本文件,一个包含 100,000 个字符串,另一个包含 1,000 个字符串,这些字符串已经存在于较大的文件中。我想减去这 1,000 个字符串,这样较大的文件就只包含 99,000 个字符串。这不是要删除重复项,而是要删除字符串。

是否有命令可以这样做。

答案1

如果字符串都在单独的行上,则可以使用grep管理系统或者赛格威如下:

C:\> grep -v -f thousandLine.txt hundred000line.txt >ninetynine000Line.txt

-v选项反转匹配,以便输出所有与 中hundred000line.txt任何行都不匹配的行thousandLine.txt。请参阅grep 手册了解更多信息。

相关内容