删除 FASTA 文件中的换行符

删除 FASTA 文件中的换行符

我有一个 fasta 文件,其中序列用换行符分隔。我想删除换行符。这是我的文件的示例:

>accession1
ATGGCCCATG
GGATCCTAGC
>accession2
GATATCCATG
AAACGGCTTA

我想把它转换成这样:

>accession1 ATGGCCCATGGGATCCTAGC
>accession2 GATATCCATGAAACGGCTTA

我想要第二个文件,其中包含两列。第一个是登录号,第二个是序列。

答案1

使用awk:

awk '/^>/&&NR>1{print "";}{printf "%s",/^>/ ? $0" " : $0}' file                                                                                          
>accession1 ATGGCCCATGGGATCCTAGC
>accession2 GATATCCATGAAACGGCTTA

相关内容