awk 根据第二列中的键对列进行平均

Question 1

和awk你一起可以做：

awk '{seen[$1]+=$2; count[$1]++} END{for (x in seen)print x, seen[x]/count[x]}' infile
Sample_A 150
Sample_B 200

或者使用GNUdatamash:

datamash -t' ' --sort --group 1 mean 2 <infile
Sample_A 150
Sample_B 200

Answer

和awk你一起可以做：

awk '{seen[$1]+=$2; count[$1]++} END{for (x in seen)print x, seen[x]/count[x]}' infile
Sample_A 150
Sample_B 200

或者使用GNUdatamash:

datamash -t' ' --sort --group 1 mean 2 <infile
Sample_A 150
Sample_B 200

Question 2

$ awk '{ sum[$1] += $2; count[$1] += 1 } END { for ( key in count ) { print key, sum[key] / count[key] } }' input
Sample_A 150
Sample_B 200

要得出平均值，您需要两件事：被平均的实体数量的计数以及这些值的总和。count对于前者，我们使用一个数组，sum对于后者，我们使用一个数组。每个数组中的键都分配给数据文件中的第一列。

END然后，在收集数据后，我们使用一个子句来查看每个数组以获取总和和计数，将一个数组除以另一个数组，然后显示结果。

该awk脚本经过重新格式化，不再全部在一行上，如下所示：

{ 
  sum[$1] += $2 
  count[$1] += 1
} 
END { 
  for (key in count) { 
    print key, sum[key] / count[key] 
  } 
}

Answer

$ awk '{ sum[$1] += $2; count[$1] += 1 } END { for ( key in count ) { print key, sum[key] / count[key] } }' input
Sample_A 150
Sample_B 200

要得出平均值，您需要两件事：被平均的实体数量的计数以及这些值的总和。count对于前者，我们使用一个数组，sum对于后者，我们使用一个数组。每个数组中的键都分配给数据文件中的第一列。

END然后，在收集数据后，我们使用一个子句来查看每个数组以获取总和和计数，将一个数组除以另一个数组，然后显示结果。

该awk脚本经过重新格式化，不再全部在一行上，如下所示：

{ 
  sum[$1] += $2 
  count[$1] += 1
} 
END { 
  for (key in count) { 
    print key, sum[key] / count[key] 
  } 
}

相关内容