我有一个定期生成报告的程序。
这些报告遵循简单且一致的格式(具体来说,这些是“OProfile 分析报告”)。
每行的格式为:
- 唯一名称,编号
我希望浏览我拥有的所有报告并计算(比如说)每个 unique_name 的平均值。
这怎么可能呢?
答案1
假设所有报告都位于一个目录中并具有.txt
扩展名。尝试以下操作:
$ cat *.txt | gawk -F, 'NF==2 { sum[$1] += $2; N[$1]++ } \
END { for (name in sum) { \
printf "%s %f\n", name, sum[name] / N[name]; } }' | sort -k2 -n