如何按第二列中的国家/地区进行分组，然后按结果总和进行排序？

Question 1

和GNU awk：

$ awk 'BEGIN{PROCINFO["sorted_in"] = "@val_num_desc"}
       {a[$2]+=$1} END{for(k in a) print a[k], k}' ip.txt
8 UA
6 US
2 GB

和perl：

perl -lane '$h{$F[1]}+=$F[0]; END{print "$h{$_} $_" for
            sort {$h{$b} <=> $h{$a}} keys %h}' ip.txt

Answer

和GNU awk：

$ awk 'BEGIN{PROCINFO["sorted_in"] = "@val_num_desc"}
       {a[$2]+=$1} END{for(k in a) print a[k], k}' ip.txt
8 UA
6 US
2 GB

和perl：

perl -lane '$h{$F[1]}+=$F[0]; END{print "$h{$_} $_" for
            sort {$h{$b} <=> $h{$a}} keys %h}' ip.txt

Question 2

使用 GNU datamash：

$ datamash -W -s -g 2 sum 1 <file
GB      2
UA      8
US      6

这会将空格视为字段分隔符，对第二个字段上的输入进行排序，在此字段上对其进行分组，并对每个组的第一个字段求和。

awk '{ print $2, $1 }'如果您想交换列（datamash始终在其输出中首先写入分组列），并且sort -nr如果您想按示例中的降序对输出进行排序，则通过管道传输输出：

$ datamash -W -s -g 2 sum 1 <file | awk '{ print $2, $1 }' | sort -nr
8 UA
6 US
2 GB

用于awk求和：

$ awk '{ sum[$2] += $1 } END { for (i in sum) print sum[i], i }' file
8 UA
2 GB
6 US

sort -nr如上所述，将其传递给排序。

Answer

使用 GNU datamash：

$ datamash -W -s -g 2 sum 1 <file
GB      2
UA      8
US      6

这会将空格视为字段分隔符，对第二个字段上的输入进行排序，在此字段上对其进行分组，并对每个组的第一个字段求和。

awk '{ print $2, $1 }'如果您想交换列（datamash始终在其输出中首先写入分组列），并且sort -nr如果您想按示例中的降序对输出进行排序，则通过管道传输输出：

$ datamash -W -s -g 2 sum 1 <file | awk '{ print $2, $1 }' | sort -nr
8 UA
6 US
2 GB

用于awk求和：

$ awk '{ sum[$2] += $1 } END { for (i in sum) print sum[i], i }' file
8 UA
2 GB
6 US

sort -nr如上所述，将其传递给排序。

相关内容