如何统计特定列中的数字频率？

Question 1

您可以使用以列值为键的关联数组，仅从第三条记录（行）开始分配值 ( NR>2)：

$ awk 'NR>2 {count[$1]++} END {for (i in count) print i, count[i]}' 1.txt
1 1
2 2
3 1
4 1
5 1
6 1
7 1
8 1
9 1
10 1
11 2
12 1
13 1
14 2
15 5
16 1
17 1

请注意，无法保证数组遍历的顺序 - 如果输出顺序很重要，您可能需要额外的排序。

Answer

您可以使用以列值为键的关联数组，仅从第三条记录（行）开始分配值 ( NR>2)：

$ awk 'NR>2 {count[$1]++} END {for (i in count) print i, count[i]}' 1.txt
1 1
2 2
3 1
4 1
5 1
6 1
7 1
8 1
9 1
10 1
11 2
12 1
13 1
14 2
15 5
16 1
17 1

请注意，无法保证数组遍历的顺序 - 如果输出顺序很重要，您可能需要额外的排序。

Question 2

尝试使用下面的脚本，效果很好

for i in `awk 'NR >2 {print $1}' p.txt| sort -k1 -n -u`; do  echo $i; awk 'NR >2 {print $1}' p.txt|awk -v i="$i" '$1 == i {print $1}'| awk '{print NR}'| sed -n '$p'; done| sed "N;s/\n/ /g"

输出

Answer

尝试使用下面的脚本，效果很好

for i in `awk 'NR >2 {print $1}' p.txt| sort -k1 -n -u`; do  echo $i; awk 'NR >2 {print $1}' p.txt|awk -v i="$i" '$1 == i {print $1}'| awk '{print NR}'| sed -n '$p'; done| sed "N;s/\n/ /g"

输出

如何统计特定列中的数字频率？

答案1

答案2

相关内容