计算文件中 awk 输出搜索的每个字符串

Question 1

这是我解决这个问题的方法：

awk '{n=1;if(NR==1)n=25;for(i=n;i<=NF;i++) a[$i]++} END{for(val in a) print val,a[val]}' input.txt

事实上，您想要捕获第一行中的字段 25 及之后的字段，需要我们检查NR变量，并设置n将在循环中使用的变量。至于a[$i]++这将是一个关联数组，其中字段是键，数组中的值将通过++运算符递增。这是awk中非常典型的字段计数方法。

Answer

这是我解决这个问题的方法：

awk '{n=1;if(NR==1)n=25;for(i=n;i<=NF;i++) a[$i]++} END{for(val in a) print val,a[val]}' input.txt

事实上，您想要捕获第一行中的字段 25 及之后的字段，需要我们检查NR变量，并设置n将在循环中使用的变量。至于a[$i]++这将是一个关联数组，其中字段是键，数组中的值将通过++运算符递增。这是awk中非常典型的字段计数方法。

Question 2

怎么样

awk '{for (i=25; i<=NF; i++) print $i; exit}' file | sort | uniq -c
  6 string1
  6 string2
  6 string3
  6 string4
  6 string5
  6 stringN

编辑：在新添加的示例输入中，在计数开始之前没有 24 个字段需要忽略，并且对第一行的限制（从第一个代码片段推断）似乎也消失了。尝试

tr -s ' ' '\n' <file |  sort | uniq -c
  2 Column1
  2 Column2
  3 Column3
  3 ColumnN

Answer

怎么样

awk '{for (i=25; i<=NF; i++) print $i; exit}' file | sort | uniq -c
  6 string1
  6 string2
  6 string3
  6 string4
  6 string5
  6 stringN

编辑：在新添加的示例输入中，在计数开始之前没有 24 个字段需要忽略，并且对第一行的限制（从第一个代码片段推断）似乎也消失了。尝试

tr -s ' ' '\n' <file |  sort | uniq -c
  2 Column1
  2 Column2
  3 Column3
  3 ColumnN

解释