将文本转换为表格

将文本转换为表格

我想将文本转换为表格。以下是文本的链接

http://www.tcdb.org/public/tcdb

简短示例:

>gnl|TC-DB|A0CIB0|1.A.17.3.1 Chromosome undetermined scaffold_19, whole genome shotgun sequence OS=Paramecium tetraurelia GN=GSPATT00007662001 PE=4 SV=1
MDDQNQPILQEQPKPKQKKPLLNTKMVKKQKMQNKKEENLREILNFYTNQVDARKFLQKM
KAVVDSNQQEKKYQDDFLNPNEYNEMQDIYEDYNMGDLVIVFPNPDADGVKNPPITYKEA
PLTKTNFYSKIGNVSYENDIDELCVDEMEYLRNMRNVDGEHMDQDHVKEEI
>gnl|TC-DB|A0CS82|9.B.82.1.5 Chromosome undetermined scaffold_26, whole genome shotgun sequence - Paramecium tetraurelia.
MIIEEQIEEKMIYKAIHRVKVNYQKKIDRYILYKKSRWFFNLLLMLLYAYRIQNIGGFYI
VTYIYCVYQLQLLIDYFTPLGLPPVNLEDEEEDDDQFQNDFSELPTTLSNKNELNDKEFR
PLLRTTSEFKVWQKSVFSVIFAYFCTYIPIWDIPVYWPFLFCYFFVIVGMSIRKYIKHMK
KYGYTILDFTKKK

我想要用管道|;

|>gnl|TC-DB|A0CIB0|1.A.17.3.1| Chromosome undetermined scaffold_19, whole genome shotgun sequence OS=Paramecium tetraurelia GN=GSPATT00007662001 PE=4 SV=1|
MDDQNQPILQEQPKPKQKKPLLNTKMVKKQKMQNKKEENLREILNFYTNQVDARKFLQKM
KAVVDSNQQEKKYQDDFLNPNEYNEMQDIYEDYNMGDLVIVFPNPDADGVKNPPITYKEA
PLTKTNFYSKIGNVSYENDIDELCVDEMEYLRNMRNVDGEHMDQDHVKEEI

我正在使用 Windows,但我不知道该怎么做

我只知道

  • 每一行都以>
  • 我想用分隔符替换行中的第一个空格,例如|;
  • 在第一个正则表达式换行之后,我还想要一个分隔符
  • 正则表达式第一个新行和之间的所有内容>都应放入新列(它是蛋白质的序列)

答案1

如果我处于你的情况,我会尝试使用支持正则表达式的编辑器。这个问题为编辑们提供了一些建议作为答案。

您还可以使用perl或具有强大正则表达式支持的另一种编程语言。您可以从活动状态或作为赛格威。Cygwin 还具有支持正则表达式的编辑器,但是为了获得一个好的 GUI 编辑器,您需要下载并配置 Cygwin 的 X-Server 部分,而这对您来说可能是一个陡峭的学习曲线。

相关内容