将维度（nxn）的矩阵转换为行*列组合的矩阵

Question 1

根据您所需的输出仅打印上三角值

awk '
  NR==1 {
    split($0,hdr," "); next
  } 
  {
    for (i=NR;i<=NF;i++) {print $1 FS hdr[i] FS $i}
  }
' file
snp1 snp1 1
snp1 snp2 0.3
snp1 snp3 0.4
snp1 snp4 0.5
snp2 snp2 1
snp2 snp3 0.4
snp2 snp4 0.5
snp3 snp3 1
snp3 snp4 0.5
snp4 snp4 1

或等效地，使用 perl

perl -alne '
  if ($. == 1) {
    @hdr = @F;
  } else {
    for $i ($.-1 .. $#F) {
      print join " ", $F[0], $hdr[$i], @F[$i];
    }
  }' file

如果您想要完整的矩阵而不仅仅是上三角形，则修改循环的起始索引for，将NR（在 awk 版本中）替换为2，或$.-1（在 perl 版本中）替换为1

Answer

根据您所需的输出仅打印上三角值

awk '
  NR==1 {
    split($0,hdr," "); next
  } 
  {
    for (i=NR;i<=NF;i++) {print $1 FS hdr[i] FS $i}
  }
' file
snp1 snp1 1
snp1 snp2 0.3
snp1 snp3 0.4
snp1 snp4 0.5
snp2 snp2 1
snp2 snp3 0.4
snp2 snp4 0.5
snp3 snp3 1
snp3 snp4 0.5
snp4 snp4 1

或等效地，使用 perl

perl -alne '
  if ($. == 1) {
    @hdr = @F;
  } else {
    for $i ($.-1 .. $#F) {
      print join " ", $F[0], $hdr[$i], @F[$i];
    }
  }' file

如果您想要完整的矩阵而不仅仅是上三角形，则修改循环的起始索引for，将NR（在 awk 版本中）替换为2，或$.-1（在 perl 版本中）替换为1

Question 2

更新

现在没有限制。

#!/bin/bash

INPUT=File1
declare -a fields

fields=( $(head -n1 "$INPUT") )

i=0
while read -r line; do
    values=( $line )
    for ((j=++i; j<${#values[@]}; j++)); do
        echo -e "${fields[$i]}" "${fields[$j]}"'\t'"${values[$j]}"
    done
done < <( tail -n+2 "$INPUT")

Answer

更新

现在没有限制。

#!/bin/bash

INPUT=File1
declare -a fields

fields=( $(head -n1 "$INPUT") )

i=0
while read -r line; do
    values=( $line )
    for ((j=++i; j<${#values[@]}; j++)); do
        echo -e "${fields[$i]}" "${fields[$j]}"'\t'"${values[$j]}"
    done
done < <( tail -n+2 "$INPUT")

Question 3

这应该很容易使用awk。

$ awk -f script.awk file1.txt
snp1 snp1 1
snp1 snp2 0.3
snp1 snp3 0.4
snp1 snp4 0.5
snp2 snp1 0.3
snp2 snp2 1
snp2 snp3 0.4
snp2 snp4 0.5
snp3 snp1 0.4
snp3 snp2 0.4
snp3 snp3 1
snp3 snp4 0.5
snp4 snp1 0.5
snp4 snp2 0.5
snp4 snp3 0.5
snp4 snp4 1

的内容script.awk。我们跳过第一行并根据需要格式化其余部分。

$ cat script.awk
{
if (NR == 1) next;
print $1" snp1 "$2;
print $1" snp2 "$3;
print $1" snp3 "$4;
print $1" snp4 "$5;
}

内容file1.txt

$ cat test.txt 
____   snp1  snp2   snp3   snp4
snp1    1     0.3   0.4    0.5  
snp2    0.3     1   0.4    0.5
snp3    0.4   0.4     1    0.5 
snp4    0.5   0.5   0.5      1

您可以将输出重定向到新文件，如下所示。

awk -f script.awk file1.txt > file2.txt

Answer

这应该很容易使用awk。

$ awk -f script.awk file1.txt
snp1 snp1 1
snp1 snp2 0.3
snp1 snp3 0.4
snp1 snp4 0.5
snp2 snp1 0.3
snp2 snp2 1
snp2 snp3 0.4
snp2 snp4 0.5
snp3 snp1 0.4
snp3 snp2 0.4
snp3 snp3 1
snp3 snp4 0.5
snp4 snp1 0.5
snp4 snp2 0.5
snp4 snp3 0.5
snp4 snp4 1

的内容script.awk。我们跳过第一行并根据需要格式化其余部分。

$ cat script.awk
{
if (NR == 1) next;
print $1" snp1 "$2;
print $1" snp2 "$3;
print $1" snp3 "$4;
print $1" snp4 "$5;
}

内容file1.txt

$ cat test.txt 
____   snp1  snp2   snp3   snp4
snp1    1     0.3   0.4    0.5  
snp2    0.3     1   0.4    0.5
snp3    0.4   0.4     1    0.5 
snp4    0.5   0.5   0.5      1

您可以将输出重定向到新文件，如下所示。

awk -f script.awk file1.txt > file2.txt

将维度（nxn）的矩阵转换为行*列组合的矩阵

答案1

答案2

更新

答案3

相关内容