我有一个像这样的分隔文本文件
Code|Grade_CD|FCST|Change_Prob|target
11245|yyy|2020-01-01|25.0124|2020
11245|yyy|2020-01-01|25.0124|2020
11245|yyy|2020-01-01|22.0124|2020
11245|yyy|2020-01-01|22.0124|2020
我需要通过忽略文件中的标题来添加“Change_Prob”列下的所有值,并将总和打印为 Total change_Prob = 94.0496
答案1
awk -F\| 'NR>1 { sum=sum+$4; }; END { print sum; }' input
答案2
awk -F'|' 'NR > 1 { sum = sum + $4 }; END { print "Total change_Prob = " sum }' infile
答案3
{
col='Change_Prob'
printf 'Total %s = ' "$col"
c=$(head -n 1 | tr '|' '\n' | grep -nxF -- "$col" | cut -d: -f1)
cut -d"|" -f"$c" - | paste -sd+ | bc -l
} < file
Total Change_Prob = 94.0496
或者,如果我们已经知道第四列有数据,那么我们也可以这样做:
$ printf 'Total Change_Prob = '
$ tail -n+2 inp | cut -d"|" -f4 - | tr :- :_ |
dc -e '[pq]sq[?z1=q+l?x]s?czdd=?'
Total Change_Prob = 94.0496