结果

Question 1

看看这个：

$ echo "$a"
paper 3
paper 6
eraser 2
pencil 9
pencil 44
pencil 1

$ awk '{a[$1]=a[$1]+$2}END{for (i in a) print i,a[i]}' <(echo "$a")
pencil 54
eraser 2
paper 9

替换<(echo "$a)为您的file：

$ awk '{a[$1]=a[$1]+$2}END{for (i in a) print i,a[i]}' file

Answer

看看这个：

$ echo "$a"
paper 3
paper 6
eraser 2
pencil 9
pencil 44
pencil 1

$ awk '{a[$1]=a[$1]+$2}END{for (i in a) print i,a[i]}' <(echo "$a")
pencil 54
eraser 2
paper 9

替换<(echo "$a)为您的file：

$ awk '{a[$1]=a[$1]+$2}END{for (i in a) print i,a[i]}' file

Question 2

使用不太标准的实用程序GNU 数据混合

$ datamash --whitespace groupby 1 sum 2 < file
paper   9
eraser  2
pencil  54

或者更简洁地说

$ datamash -Wg 1 sum 2 < file
paper   9
eraser  2
pencil  54

Answer

使用不太标准的实用程序GNU 数据混合

$ datamash --whitespace groupby 1 sum 2 < file
paper   9
eraser  2
pencil  54

或者更简洁地说

$ datamash -Wg 1 sum 2 < file
paper   9
eraser  2
pencil  54

Question 3

如果我们关心打印的顺序，那么我们可以这样做：

perl -lane '$h{$F[0]}+=$F[1]; $h[-1+keys%h]=$F[0]; END{print "$_ $h{$_}" for @h}'

这个想法是维护哈希中特定项目的运行总和%h以及特定项目在数组中出现的顺序@h。在文件末尾，我们只打印散列（键+值），但从@h数组中获取顺序。

结果

paper 9
eraser 2
pencil 54

Answer

如果我们关心打印的顺序，那么我们可以这样做：

perl -lane '$h{$F[0]}+=$F[1]; $h[-1+keys%h]=$F[0]; END{print "$_ $h{$_}" for @h}'

这个想法是维护哈希中特定项目的运行总和%h以及特定项目在数组中出现的顺序@h。在文件末尾，我们只打印散列（键+值），但从@h数组中获取顺序。

结果

paper 9
eraser 2
pencil 54

Question 4

这是 awk 中的一个不太可爱的衬里：

awk '{ if (prev && prev != $1) { print prev, sum; sum = 0 }; sum += $2; prev = $1 } END { print prev, sum }' < file.txt

它要求将第一个字段中具有相同值的行分组在一起。如果不是这种情况，您可以sort file.txt | awk ...。

Answer

这是 awk 中的一个不太可爱的衬里：

awk '{ if (prev && prev != $1) { print prev, sum; sum = 0 }; sum += $2; prev = $1 } END { print prev, sum }' < file.txt

它要求将第一个字段中具有相同值的行分组在一起。如果不是这种情况，您可以sort file.txt | awk ...。

结果

答案1

答案2

答案3

结果

答案4

相关内容