使用awk/sed/perl组织三维数据

Question 1

在 Perl 中：

#!/usr/bin/perl

my (%hotu, %hpc)=();
while(<>){
  my($pc,$otu,$v)=split;
  $hpc{$pc}=1;
  ($hotu{$otu} or $hotu{$otu}={})->{$pc}+=$v;
}
#headers
my @apc = sort keys %hpc;
print join ("\t", 'OTU_ID', @apc) . "\n";
#values
foreach my $otu (sort keys %hotu) {
  print join ("\t", $otu, map {$_=0 unless defined; $_} @{$hotu{$otu}}{@apc}) . "\n";
}

Answer

在 Perl 中：

#!/usr/bin/perl

my (%hotu, %hpc)=();
while(<>){
  my($pc,$otu,$v)=split;
  $hpc{$pc}=1;
  ($hotu{$otu} or $hotu{$otu}={})->{$pc}+=$v;
}
#headers
my @apc = sort keys %hpc;
print join ("\t", 'OTU_ID', @apc) . "\n";
#values
foreach my $otu (sort keys %hotu) {
  print join ("\t", $otu, map {$_=0 unless defined; $_} @{$hotu{$otu}}{@apc}) . "\n";
}

Question 2

在awk：

{ data[$2, $1] = $3; }
END {
    split("OTU0 OTU1 OTU2 OTU3", rows);
    split("OTU_ID PC.354 PC.355 PC.356", cols);
    for (i = 1; i <= 4; i++) {
        printf("%10s", cols[i]);
    }
    print "";
    for (i = 1; i <= 4; i++) {
        printf("%-10s", rows[i]);
        for (j = 2; j <= 4; j++) {
            item = data[rows[i], cols[j]];
            if (!item) { item = "0" };
            printf("%10s", item);
        }
        print "";
    }
}

请注意，我已明确包含示例输出中的所有行和列。如果数据实际上包含所有行和列（示例数据不包含这些），则没有必要这样做。

Answer

在awk：

{ data[$2, $1] = $3; }
END {
    split("OTU0 OTU1 OTU2 OTU3", rows);
    split("OTU_ID PC.354 PC.355 PC.356", cols);
    for (i = 1; i <= 4; i++) {
        printf("%10s", cols[i]);
    }
    print "";
    for (i = 1; i <= 4; i++) {
        printf("%-10s", rows[i]);
        for (j = 2; j <= 4; j++) {
            item = data[rows[i], cols[j]];
            if (!item) { item = "0" };
            printf("%10s", item);
        }
        print "";
    }
}

请注意，我已明确包含示例输出中的所有行和列。如果数据实际上包含所有行和列（示例数据不包含这些），则没有必要这样做。

使用awk/sed/perl组织三维数据

答案1

答案2

相关内容