根据列表中的新 ID 替换 fasta 文件的 seq ID

Question 1

使用awk：

awk -F'\t' '
  NR==FNR{ a[$1]=$2; next }
  /^>/{ 
    id=a[substr($0, 2)]
    if (id!=""){ print ">" id; next }
  }
  1
' textfile file.fasta

首先，读取包含映射的文本文件，并a使用第一个字段作为索引将第二个字段保存在数组中。跳到next记录。

然后读取fasta文件。如果记录以开头，则通过从当前记录 ( ) 中删除第一个字符并使用该值作为数组索引来>从数组中查找新的 id 。如果 id 不为空，则打印id 并跳到该记录。substr($0, 2)
>next

打印1当前记录（序列或不匹配的 ID）。

Answer

使用awk：

awk -F'\t' '
  NR==FNR{ a[$1]=$2; next }
  /^>/{ 
    id=a[substr($0, 2)]
    if (id!=""){ print ">" id; next }
  }
  1
' textfile file.fasta

首先，读取包含映射的文本文件，并a使用第一个字段作为索引将第二个字段保存在数组中。跳到next记录。

然后读取fasta文件。如果记录以开头，则通过从当前记录 ( ) 中删除第一个字符并使用该值作为数组索引来>从数组中查找新的 id 。如果 id 不为空，则打印id 并跳到该记录。substr($0, 2)
>next

打印1当前记录（序列或不匹配的 ID）。

Question 2

awk -F'\t' '
    NR==FNR { map[">"$1] = ">"$2; next }
    $0 in map { $0 = map[$0] }
    { print }
' mapfile fastafile

Answer

awk -F'\t' '
    NR==FNR { map[">"$1] = ">"$2; next }
    $0 in map { $0 = map[$0] }
    { print }
' mapfile fastafile

相关内容