仅在特定列中插入双引号

Question 1

像这样：

sed 's/=/ "/g; s/;/";/g' file.gtf

或者

sed -e 's/=/ "/g' -e 's/;/";/g' file.gtf

chr1    CAT     gene_id "RP11-54O7.16";transcript_id "ENST00000607769.1-1";
chr1    CAT     gene_id "RP11-54O7.16";transcript_id "ENST00000607769.1-2";

Answer

像这样：

sed 's/=/ "/g; s/;/";/g' file.gtf

或者

sed -e 's/=/ "/g' -e 's/;/";/g' file.gtf

chr1    CAT     gene_id "RP11-54O7.16";transcript_id "ENST00000607769.1-1";
chr1    CAT     gene_id "RP11-54O7.16";transcript_id "ENST00000607769.1-2";

Question 2

$ awk '{ split($0, a , " +|[=;]", seps); '\
'print a[1] seps[1] a[2] seps[2] a[3] " \"" a[4] "\";" a[5] " \"" a[6] "\""; }' input

chr1    CAT     gene_id "RP11-54O7.16";transcript_id "ENST00000607769.1-1"
chr1    CAT     gene_id "RP11-54O7.16";transcript_id "ENST00000607769.1-2"

Answer

$ awk '{ split($0, a , " +|[=;]", seps); '\
'print a[1] seps[1] a[2] seps[2] a[3] " \"" a[4] "\";" a[5] " \"" a[6] "\""; }' input

chr1    CAT     gene_id "RP11-54O7.16";transcript_id "ENST00000607769.1-1"
chr1    CAT     gene_id "RP11-54O7.16";transcript_id "ENST00000607769.1-2"

Question 3

命令

awk -v replace=' "' -v bo='"' '{gsub(/=/,replace,$0);gsub(";",bo";",$0);print}' file.txt

输出

chr1    CAT     gene_id "RP11-54O7.16";transcript_id "ENST00000607769.1-1";
chr1    CAT     gene_id "RP11-54O7.16";transcript_id "ENST00000607769.1-2";

Python

#!/usr/bin/python
import re
l=open('filename','r')
for i in l:
    print i.strip().replace('=',' "').replace(';','";')

输出

chr1    CAT     gene_id "RP11-54O7.16";transcript_id "ENST00000607769.1-1";
chr1    CAT     gene_id "RP11-54O7.16";transcript_id "ENST00000607769.1-2";

Answer

命令

awk -v replace=' "' -v bo='"' '{gsub(/=/,replace,$0);gsub(";",bo";",$0);print}' file.txt

输出

chr1    CAT     gene_id "RP11-54O7.16";transcript_id "ENST00000607769.1-1";
chr1    CAT     gene_id "RP11-54O7.16";transcript_id "ENST00000607769.1-2";

Python

#!/usr/bin/python
import re
l=open('filename','r')
for i in l:
    print i.strip().replace('=',' "').replace(';','";')

输出

chr1    CAT     gene_id "RP11-54O7.16";transcript_id "ENST00000607769.1-1";
chr1    CAT     gene_id "RP11-54O7.16";transcript_id "ENST00000607769.1-2";

Question 4

$ sed 's/=\([^;]*\)/ "\1"/g' file
chr1    CAT     gene_id "RP11-54O7.16";transcript_id "ENST00000607769.1-1";
chr1    CAT     gene_id "RP11-54O7.16";transcript_id "ENST00000607769.1-2";

Answer

$ sed 's/=\([^;]*\)/ "\1"/g' file
chr1    CAT     gene_id "RP11-54O7.16";transcript_id "ENST00000607769.1-1";
chr1    CAT     gene_id "RP11-54O7.16";transcript_id "ENST00000607769.1-2";

仅在特定列中插入双引号

答案1

答案2

答案3

答案4

相关内容