awk 搜索帮助

Question 1

我不知道你对命名列有什么意见。如果你想指定其中的内容，你需要具体地调用它们。

awk 'NR>1 && $2~/^[KJ]$/ && $3~/^[KP]$/ {print $1}' ...

这将匹配K-K、K-P和J-K并J-P打印名称列。它还将跳过看起来像标题的第一行。

它与示例中的以下几行相匹配：

NINA        K        K       kevdhekdmabr2738
NINA        J        P       pdbkemgwjsabeb483
NINA        J        K       amfjekspdbejd34549

但显然只打印NINA。

Answer

我不知道你对命名列有什么意见。如果你想指定其中的内容，你需要具体地调用它们。

awk 'NR>1 && $2~/^[KJ]$/ && $3~/^[KP]$/ {print $1}' ...

这将匹配K-K、K-P和J-K并J-P打印名称列。它还将跳过看起来像标题的第一行。

它与示例中的以下几行相匹配：

NINA        K        K       kevdhekdmabr2738
NINA        J        P       pdbkemgwjsabeb483
NINA        J        K       amfjekspdbejd34549

但显然只打印NINA。

Question 2

据我了解，您想要显示符合此条件的行：

每行任意一列包含两个“K”标记，且下一行包含：第一个“K”同一列中的“J”标记和第二个“K”同一列中的“P”标记

这个程序可以满足你的需要

     BEGIN { nlines = 0; }              
     {   
       lines[nlines] = $0;   
       kfound[nlines] = "";   
       jfound[nlines] = "";   
       pfound[nlines] = "";   
       for (i=1;i<=NF;i++) {
          if ($(i) == "K") kfound[nlines] = kfound[nlines] " " i;
          if ($(i) == "J") jfound[nlines] = i;
          if ($(i) == "P") pfound[nlines] = i;   
       }   
       nlines++; 
     } 
     END {   
        for(i=0;i<nlines;i++) {
           ntok = split(kfound[i],tok," ");
           if (ntok < 2) continue;
           if (tok[1] == jfound[i+1] && tok[2] == pfound[i+1]) {
              print lines[i];
              print lines[i+1];
           }   
        } 
     }

保存在文件 test.awk 中并尝试：

awk -f test.awk fileWithInputLine.txt

Answer

据我了解，您想要显示符合此条件的行：

每行任意一列包含两个“K”标记，且下一行包含：第一个“K”同一列中的“J”标记和第二个“K”同一列中的“P”标记

这个程序可以满足你的需要

     BEGIN { nlines = 0; }              
     {   
       lines[nlines] = $0;   
       kfound[nlines] = "";   
       jfound[nlines] = "";   
       pfound[nlines] = "";   
       for (i=1;i<=NF;i++) {
          if ($(i) == "K") kfound[nlines] = kfound[nlines] " " i;
          if ($(i) == "J") jfound[nlines] = i;
          if ($(i) == "P") pfound[nlines] = i;   
       }   
       nlines++; 
     } 
     END {   
        for(i=0;i<nlines;i++) {
           ntok = split(kfound[i],tok," ");
           if (ntok < 2) continue;
           if (tok[1] == jfound[i+1] && tok[2] == pfound[i+1]) {
              print lines[i];
              print lines[i+1];
           }   
        } 
     }

保存在文件 test.awk 中并尝试：

awk -f test.awk fileWithInputLine.txt

awk 搜索帮助

答案1

答案2

相关内容