计算每行文本出现的次数

Question 1

这一行应该能够做你想做的事：

grep -v ignore input.txt | sed 's/format300/format300\n/g' | grep -c "format300"

基本上，您将每次出现的关键字替换为关键字本身和换行符，这实际上使您的输入流在任何给定行上仅具有关键字一次。然后grep -c是计算其中包含您的关键字的行数。

Answer

这一行应该能够做你想做的事：

grep -v ignore input.txt | sed 's/format300/format300\n/g' | grep -c "format300"

基本上，您将每次出现的关键字替换为关键字本身和换行符，这实际上使您的输入流在任何给定行上仅具有关键字一次。然后grep -c是计算其中包含您的关键字的行数。

Question 2

你不需要第一个cat，它被称为猫的无用使用（UUOC）。

此外，非常有用的是grep -o，它只输出匹配的模式，每行一个。

然后，用计数行数wc -l。

grep -v ignore YOUR_FILE | grep -o format300 | wc -l

这将打印3您的小样本。

Answer

你不需要第一个cat，它被称为猫的无用使用（UUOC）。

此外，非常有用的是grep -o，它只输出匹配的模式，每行一个。

然后，用计数行数wc -l。

grep -v ignore YOUR_FILE | grep -o format300 | wc -l

这将打印3您的小样本。

Question 3

输入文件可能包含部分匹配，这会使结果无效，例如：

1 format300,format250,format300
2 format250,ignore,format160,format300,format300
3 format250,format250,format300
4 format999,format300000,format999
5 format999,ignore_me_not,format300

您不想计数format300000第 4 行或忽略第 5 行，因为ignore_me_not包含子字符串ignore。

这可以解决问题：

grep -v "\bignore\b" FILE |grep -o "\bformat300\b"|wc -l

正确的输出是

..因为第 2 行被忽略，第 5 行未被忽略，并且第 4 行不完全包含format300.

如果将wc -l零件放出来，您可以看到到底匹配的是什么：

Answer