我有一个 fasta 文件,其中序列用换行符分隔。我想删除换行符。这是我的文件的示例:
>accession1
ATGGCCCATG
GGATCCTAGC
>accession2
GATATCCATG
AAACGGCTTA
我想把它转换成这样:
>accession1 ATGGCCCATGGGATCCTAGC
>accession2 GATATCCATGAAACGGCTTA
我想要第二个文件,其中包含两列。第一个是登录号,第二个是序列。
答案1
使用awk:
awk '/^>/&&NR>1{print "";}{printf "%s",/^>/ ? $0" " : $0}' file
>accession1 ATGGCCCATGGGATCCTAGC
>accession2 GATATCCATGAAACGGCTTA