按组计算出现次数

Question 1

使用关联数组来awk计算每个组中零的出现次数：

awk '$3 == 0 && ++count[$1] || count[$1] { next } END { for (group in count) printf("%s%s%d\n", group, OFS, count[group]) }' file

稍显尴尬的

$3 == 0 && ++count[$1] || count[$1] { next }

将测试第三列是否为零，如果是，则增加该组的计数器。如果不是，它仍然会在count数组中为该组实例化一个空元素。我们需要它能够报告末尾有零个零的组。这next只是为了跳到下一个输入行。

muru 在评论中指出，这一位可以用稍微短一点的来代替

{ count[$1] += ($3 == 0) }

其中$3 == 0为 0 或 1，具体取决于第三列中的值。

最后的输出是通过以下方式完成的printf()：

printf("%s%s%d\n", group, OFS, count[group])

这将打印该组（从输入数据的第一列开始）以及相应的零计数，OFS中间有（输出字段分隔符；默认为空格字符）。

如果一组缺少计数，printf()格式%d将插入零。

测试：

$ awk '$3 == 0 && ++count[$1] || count[$1] { next } END { for (group in count) printf("%s%s%d\n", group, OFS, count[group]) }' file
A 2
B 0

Answer