根据csv中的几个列条件计算awk的平均值

Question

作为@Archemar指出，您正在使用不同的数组键。我将它们更改为$1"-"$2更好地匹配您的输出。

另一个问题是字段 2 和字段 3 被引用，这不利于计算，因为字段 3 的值被视为零。快速解决方法是将所有引号替换$0为空字符串。

awk -F',' '{
  gsub(/"/, "")
  airline[$1"-"$2]+=$3
  ++count[$1"-"$2]
}
END {
  for (key in airline) print "Average of",key,"is",airline[key]/count[key]
}' file

输出：

Average of EN-New York City is 9
Average of AB-Boston is 3.5
Average of EV-Houston is -7
Average of OO-Mystic is 13

如果“计算第三列的所有正值的平均值”意味着只应考虑正值，则添加if如下语句。我不完全确定这是否是您想要的。

awk -F',' '{
  gsub(/"/, "")
  if ($3>0) {
    airline[$1"-"$2]+=$3
    ++count[$1"-"$2]
  }
}
END {
  for (key in airline) print "Average of",key,"is",airline[key]/count[key]
}' file

输出：

Average of EN-New York City is 9
Average of AB-Boston is 19
Average of OO-Mystic is 13

Answer 1

作为@Archemar指出，您正在使用不同的数组键。我将它们更改为$1"-"$2更好地匹配您的输出。

另一个问题是字段 2 和字段 3 被引用，这不利于计算，因为字段 3 的值被视为零。快速解决方法是将所有引号替换$0为空字符串。

awk -F',' '{
  gsub(/"/, "")
  airline[$1"-"$2]+=$3
  ++count[$1"-"$2]
}
END {
  for (key in airline) print "Average of",key,"is",airline[key]/count[key]
}' file

输出：

Average of EN-New York City is 9
Average of AB-Boston is 3.5
Average of EV-Houston is -7
Average of OO-Mystic is 13

如果“计算第三列的所有正值的平均值”意味着只应考虑正值，则添加if如下语句。我不完全确定这是否是您想要的。

awk -F',' '{
  gsub(/"/, "")
  if ($3>0) {
    airline[$1"-"$2]+=$3
    ++count[$1"-"$2]
  }
}
END {
  for (key in airline) print "Average of",key,"is",airline[key]/count[key]
}' file

输出：

Average of EN-New York City is 9
Average of AB-Boston is 19
Average of OO-Mystic is 13

根据csv中的几个列条件计算awk的平均值

答案1

相关内容