编辑 FASTA 标题

编辑 FASTA 标题

我想删除 fasta 文件中的所有序列的部分标题,以便只有 Otu 编号作为标题出现。

因此来自:

>M02300_51_000000000-CJMTC_1_1115_17014_15334   Otu0001  
T-AC--GG-AG-GGT---GCA-A-G-C--G-T-T--AA-T-CGG-AA--TT-A-C-T

我想将其更改为:

>Otu0001  
T-AC--GG-AG-GGT---GCA-A-G-C--G-T-T--AA-T-CGG-AA--TT-A-C-T

我相信使用 sed 命令应该可以实现这一点,但无法让它工作。任何帮助都非常好!提前谢谢您。

答案1

我对 FASTA 的结构一无所知,但如果子字符串Otu不能出现在标题中的其他任何地方,那么

sed 's/^>.*Otu/>Otu/' file.fasta

应该这样做

相关内容