计算文件第一列中的出现次数

Question

如果输入已排序，则可以使用 uniq：

<infile cut -d' ' -f1 | uniq -c

如果没有，先排序：

<infile cut -d' ' -f1 | sort -n | uniq -c

输出：

  3 1                                      
  1 3
  2 52

输出已根据您的要求进行了交换，您可以使用awk '{ print $2, $1 }'它来更改它。

1 3 
3 1
52 2

还有 awk 习语，它不需要排序的输入：

awk '{h[$1]++}; END { for(k in h) print k, h[k] }'

输出：

1 3
52 2
3 1

由于此处的输出来自哈希，因此将不会被排序，sort -n如果需要则传递给：

awk '{h[$1]++} END { for(k in h) print k, h[k] }' | sort -n

如果您使用 GNU awk，您可以在 awk 内部进行排序：

awk '{h[$1]++} END { n = asorti(h, d, "@ind_num_asc"); for(i=1; i<=n; i++) print d[i], h[d[i]] }'

最后两种情况下的输出是：

1 3
3 1
52 2

Answer 1

如果输入已排序，则可以使用 uniq：

<infile cut -d' ' -f1 | uniq -c

如果没有，先排序：

<infile cut -d' ' -f1 | sort -n | uniq -c

输出：

  3 1                                      
  1 3
  2 52

输出已根据您的要求进行了交换，您可以使用awk '{ print $2, $1 }'它来更改它。

1 3 
3 1
52 2

还有 awk 习语，它不需要排序的输入：

awk '{h[$1]++}; END { for(k in h) print k, h[k] }'

输出：

1 3
52 2
3 1

由于此处的输出来自哈希，因此将不会被排序，sort -n如果需要则传递给：

awk '{h[$1]++} END { for(k in h) print k, h[k] }' | sort -n

如果您使用 GNU awk，您可以在 awk 内部进行排序：

awk '{h[$1]++} END { n = asorti(h, d, "@ind_num_asc"); for(i=1; i<=n; i++) print d[i], h[d[i]] }'

最后两种情况下的输出是：

1 3
3 1
52 2

相关内容