确认缺失数据时，具有相同 ID 的所有行的列中的平均值

Question

仅当 WD 字段非空时，您才能添加计数。

$ awk '
    NR>1 {sum[$1] += $5; count[$1] += $5=="" ? 0 : 1} 
    END {for (i in sum) print i, (count[i] > 0 ? sum[i]/count[i] : "-")}
  ' WD.txt
1001 36.1111
1002 -
1003 79.0789

如果你不想重新发明轮子，那么你可以使用磨坊主，它stats1似乎按照您想要的方式处理空字段：

$ mlr --pprint stats1 -g PLOT -a mean -f WD WD.txt 
PLOT WD_mean
1001 36.111100
1002 -
1003 79.078950

Miller 可从universe存储库获取 Ubuntu 版本。

Answer 1

仅当 WD 字段非空时，您才能添加计数。

$ awk '
    NR>1 {sum[$1] += $5; count[$1] += $5=="" ? 0 : 1} 
    END {for (i in sum) print i, (count[i] > 0 ? sum[i]/count[i] : "-")}
  ' WD.txt
1001 36.1111
1002 -
1003 79.0789

如果你不想重新发明轮子，那么你可以使用磨坊主，它stats1似乎按照您想要的方式处理空字段：

$ mlr --pprint stats1 -g PLOT -a mean -f WD WD.txt 
PLOT WD_mean
1001 36.111100
1002 -
1003 79.078950

Miller 可从universe存储库获取 Ubuntu 版本。

确认缺失数据时，具有相同 ID 的所有行的列中的平均值

答案1

相关内容