获取第一列条目重复的所有条目的列平均值

Question 1

尝试

 awk '{c[$1]++ ; t[$1]+=$4 }  
    END { for (cc in c ) if ( c[cc]>1 ) printf "%s : %.1f\n",cc,t[cc]/c[cc];}' file.log

这给了

30903 : 49.5

要获得输出，请删除if (c[cc]>1)部分。

该脚本基本上是计数c[$1]++和t[$1]+=$4增值。

最后，我们循环所有值，计算并打印平均值。

Answer

尝试

 awk '{c[$1]++ ; t[$1]+=$4 }  
    END { for (cc in c ) if ( c[cc]>1 ) printf "%s : %.1f\n",cc,t[cc]/c[cc];}' file.log

这给了

30903 : 49.5

要获得输出，请删除if (c[cc]>1)部分。

该脚本基本上是计数c[$1]++和t[$1]+=$4增值。

最后，我们循环所有值，计算并打印平均值。

Question 2

mlr --nidx stats1 -a mean -f 4 -g 1 inputFile

并有

30901 89.000000
30902 51.000000
30903 49.500000
30904 59.000000

Answer

mlr --nidx stats1 -a mean -f 4 -g 1 inputFile

并有

30901 89.000000
30902 51.000000
30903 49.500000
30904 59.000000

相关内容