我想删除 fasta 文件中的所有序列的部分标题,以便只有 Otu 编号作为标题出现。
因此来自:
>M02300_51_000000000-CJMTC_1_1115_17014_15334 Otu0001
T-AC--GG-AG-GGT---GCA-A-G-C--G-T-T--AA-T-CGG-AA--TT-A-C-T
我想将其更改为:
>Otu0001
T-AC--GG-AG-GGT---GCA-A-G-C--G-T-T--AA-T-CGG-AA--TT-A-C-T
我相信使用 sed 命令应该可以实现这一点,但无法让它工作。任何帮助都非常好!提前谢谢您。
答案1
我对 FASTA 的结构一无所知,但如果子字符串Otu
不能出现在标题中的其他任何地方,那么
sed 's/^>.*Otu/>Otu/' file.fasta
应该这样做