根据csv中的列条件计算awk的平均值

Question 1

看一下这个：

awk -F, '{date1[$4]+=$1;++date2[$4]}END{for (key in date1) print "Average of",key,"is",date1[key]/date2[key]}' file
Average of 27:May:2017 is 2677.57
Average of 26:May:2017 is 1410.02
Average of 25:May:2017 is 2940.02

解释：

-F,：定义分隔符。或者可以是awk 'BEGIN{FS=","}...

然后我们创建两个数组date1，date2其中我们使用第四个字段$4作为数组索引/键，使用第一个字段$1作为添加到同一数组位置的现有值的值。

所以对于第一行我们会有

date1[27:May:2017]+=2415.02
++date2[27:May:2017]--> 将值增加 1 --> 第一行的值 1

对于下一个相同的日期（第 2 行），我们将有

date1[27:May:2017]+=2415.02 + 3465.02
++date2[27:May:2017]--> 将值增加 1 --> 值 2（第二行）

相同的逻辑扩展到具有相同日期的所有行以及所有不同的日期。

最后，我们使用循环for来迭代数组的键date1（或者date2- 两个数组中的键相同 => $4），对于每个key找到的值，我们打印key(=日期 $4) 并且我们还打印date1[key]值 = 的总和$1同一日期的所有值$4除以date2[key]值 = 找到的具有相同日期的行的数字计数 = 相同$4。

Answer