如何按列求和目录中所有文件的内容

如何按列求和目录中所有文件的内容

我想按列添加这些文件,即文件 1 的第 1 列应添加到文件 2 的第 1 列,依此类推......,类似地,文件 1 的第 2 列应添加到文件 2 的第 2 列...... ..

Col1(File1) + Col1(File2) + Col1(File3) .............. + Col1(File'n') = Col1(output_file)

Col2(File1) + Col2(File2) + Col2(File3) .............. + Col2(File'n') = Col2(output_file)

或者如果文件是这样的

File 1          File 2          File n                   Output File 
a   d           b   e           c   f               a+b+...+c   d+e+....+f
c   d           c   d           a   b               c+c+...+a   d+d+....+b
e   f           e   f           a   b                   .       .
g   h      +    g   h           a   b               .       .
.   .           .   ......+......   .       =       .       .
.   .           .   .           .   .                   .       .
.   .           .   .           .   .                   .       .
.   .           .   .           .   .                   .       .
.   .           .   .           .   .                   .       .

答案1

这是执行此操作的一种方法perl

#!/usr/bin/perl

use strict;

my @lines=();

# read and sum the columns of all input files.
foreach my $file (@ARGV) {
  my $lc=0;   # line counter

  open(FH,'<',$file) or die "couldn't open $_ for write: $!\n";

  while (<FH>) {
    # split columns by whitespace.  change to suit your input.
    my @fields=split;

    my $fc=0;   # field counter

    while ($fc < @fields) {
      $lines[$lc]->[$fc] += $fields[$fc++];
    };
    $lc++;
  };

  close(FH);
};

# now output the summed lines
foreach my $lc (0..@lines-1) {
  # output columns separated by a TAB (\t).  Change as required.
  print join("\t", @{ $lines[$lc] } ),"\n";
}

对所有输入文件的每行列进行求和。

字段中的非数字值被视为 0。

适用于具有相同或不同行数的文件。

如果文件每行具有不同数量的字段,它甚至可以工作(尽管输出可能不是您所期望的,甚至不可用 - 不推荐)。

相关内容