我有很多文件,这些文件的名称如下:DOS1、DOS2、DOS3、DOS4、...、DOS128。每个文件包含四列(第一列相同),带有数字,如下所示:
DOS1 是:
33 12 1 2
16 32 8 1
9 90 17 5
...
DOS2 是:
33 1 2 1
16 3 4 3
9 1 1 1
...
我想对指定 DOSX 文件(例如 DOS1 和 DOS2)中的第二、第三和第四列求和,以获得 DOS_sum:
33 13 3 3
16 35 12 4
9 91 18 6
...
我怎样才能做到这一点?
答案1
和awk
:
awk '{a[FNR]=$1;b[FNR]+=$2;c[FNR]+=$3;d[FNR]+=$4} END{for (i=1;i<=FNR;i++) print a[i], b[i], b[i], d[i]}' DOS1 DOS2 > DOS_sum
更具可读性:
{
a[FNR]=$1 # Keep the first column
b[FNR]+=$2 # Sum the rest. FNR is the current line number
c[FNR]+=$3 # in the current file. So this accumulates
d[FNR]+=$4 # the values of a given line number across files.
}
END {
for (i=1; i<=FNR; i++)
print a[i], b[i], c[i], d[i]
}
使用 bash 的括号扩展来对一系列文件求和:
awk '{a[FNR]=$1;b[FNR]+=$2;c[FNR]+=$3;d[FNR]+=$4} END{for (i=1;i<=FNR;i++) print a[i], b[i], b[i], d[i]}' DOS{10..73}