替换 hapmap 数据集中的字符

Question 1

和perl

$ perl -F'\s+|/' -lape '
     s/^(\S+\s+){4}\K.*/$&=~s|$F[2]|$F[1]|gr/e;
     s/^(\S+\s+){4}\K.*/$&=~s|[RYSWKM]|$F[2]|gr/e
  ' ip.txt
rs#    alleles  chro    pos    ind1 ind2 ind3 ind4 ind5 ind6. . 
mar_1   G/T     1       2386806 G    G    G    G   T    G    
mar_2   T/G     1       2386848 T    T    T    G   T    G
mar_3   G/T     1       2387553 G    T    G    T   G    G
mar_4   G/A     1       2564608 G    G    G    N   A    G
mar_5   C/T     1       2564616 C    T    C    T   C    N

-F'\s+|/'按空格或/字符分割输入行，保存在@F数组中
^(\S+\s+){4}\K.*将获取除前四列之外的所有列
$&=~s|$F[2]|$F[1]在匹配部分（前四列除外）执行另一次替换
- $F[2]将包含之后的字符/并且$F[1]将包含之前的字符/
修饰符r返回最终替换的字符串，并且e修饰符允许在替换部分使用 Perl 代码
由于再次使用相同的模式，第二次替换也可以缩短为s//$&=~s|[RYSWKM]|$F[2]|gr/e
看命令开关-lape有关选项的解释

Answer

和perl

$ perl -F'\s+|/' -lape '
     s/^(\S+\s+){4}\K.*/$&=~s|$F[2]|$F[1]|gr/e;
     s/^(\S+\s+){4}\K.*/$&=~s|[RYSWKM]|$F[2]|gr/e
  ' ip.txt
rs#    alleles  chro    pos    ind1 ind2 ind3 ind4 ind5 ind6. . 
mar_1   G/T     1       2386806 G    G    G    G   T    G    
mar_2   T/G     1       2386848 T    T    T    G   T    G
mar_3   G/T     1       2387553 G    T    G    T   G    G
mar_4   G/A     1       2564608 G    G    G    N   A    G
mar_5   C/T     1       2564616 C    T    C    T   C    N

-F'\s+|/'按空格或/字符分割输入行，保存在@F数组中
^(\S+\s+){4}\K.*将获取除前四列之外的所有列
$&=~s|$F[2]|$F[1]在匹配部分（前四列除外）执行另一次替换
- $F[2]将包含之后的字符/并且$F[1]将包含之前的字符/
修饰符r返回最终替换的字符串，并且e修饰符允许在替换部分使用 Perl 代码
由于再次使用相同的模式，第二次替换也可以缩短为s//$&=~s|[RYSWKM]|$F[2]|gr/e
看命令开关-lape有关选项的解释

Question 2

perl -F'/(\s+|\/)/' -lne '
   print @F[0..9], map { s/($F[4])|([RYSWKM])/$2?$F[4]:$F[2]/re } @F[10..$#F];
' hapmap.txt

sed -e '
   s/^\(\S\+\s\+\)\{4\}/&\n/                           # mark col-4

  :a
  s|^\(\S\+\s\+\(.\)/\(.\).*\n.*\)\3|\1\2|g;ta         # perform sub-1

  :b
  s|^\(\S\+\s\+\(.\)/\(.\).*\n.*\)[RYSWKM]|\1\3|g;tb   # perform sub-2

  s/\n//g                                              # throw away marker
' hap_map.txt

Answer

perl -F'/(\s+|\/)/' -lne '
   print @F[0..9], map { s/($F[4])|([RYSWKM])/$2?$F[4]:$F[2]/re } @F[10..$#F];
' hapmap.txt

sed -e '
   s/^\(\S\+\s\+\)\{4\}/&\n/                           # mark col-4

  :a
  s|^\(\S\+\s\+\(.\)/\(.\).*\n.*\)\3|\1\2|g;ta         # perform sub-1

  :b
  s|^\(\S\+\s\+\(.\)/\(.\).*\n.*\)[RYSWKM]|\1\3|g;tb   # perform sub-2

  s/\n//g                                              # throw away marker
' hap_map.txt

替换 hapmap 数据集中的字符

答案1

答案2

相关内容