chr二号71865 72972 YBL081W。 + SGD 基因。 ID=YBL081W;名称=YBL081W;Ontology_term=GO:0003674,GO:0005575,GO:0008150;注意=非必需%20蛋白质%20of%20unknown%20function%3B%20null%20mutation%20results%20in%20a%20decrease% 20in%20plasma%20membrane%20电子%20transport;dbxref=SGD:S000000177;orf_classification=未表征
我有一个 bed 文件,其中包含 gff 格式的许多基因数据。我需要从第一列中删除前 3 个字符,例如从第一列的 chrII 中删除 chr,并且只需要罗马数字。
我想看到这样的输出
二号71865 72972 YBL081W。 + SGD 基因。 ID=YBL081W;名称=YBL081W;Ontology_term=GO:0003674,GO:0005575,GO:0008150;注意=非必需%20蛋白质%20of%20unknown%20function%3B%20null%20mutation%20results%20in%20a%20decrease% 20in%20plasma%20membrane%20电子%20transport;dbxref=SGD:S000000177;orf_classification=未表征
答案1
此命令打印出 的每一行的第 4 到 500 个字符file.gff
,从而删除前 3 个字符,并将结果保存在 中newfile.gff
:
cut -c4-500 file.gff > newfile.gff
如果您的行长度超过 500 个字符,请相应地增加上限。