匹配patternA并仅在patternB匹配时打印它，包括以下行

Question 1

awk '
   $0 ~ /mod/ { md=$0 }
   $0 ~ /search_string/ { if(md!="") { print md }; md="" ; print; getline; print }
   '

解释：

包含的行mod另存为md.
search_string包含触发打印先前保存的行md、该行本身和下一行的行。
if(md!="")并md=""确保当单个（在您的示例中）下mod有多个 -s 时不会出现重复行。search_stringmodmod start3

笔记：

mod包含和的行将search_string打破这个逻辑。

Answer

awk '
   $0 ~ /mod/ { md=$0 }
   $0 ~ /search_string/ { if(md!="") { print md }; md="" ; print; getline; print }
   '

解释：

包含的行mod另存为md.
search_string包含触发打印先前保存的行md、该行本身和下一行的行。
if(md!="")并md=""确保当单个（在您的示例中）下mod有多个 -s 时不会出现重复行。search_stringmodmod start3

笔记：

mod包含和的行将search_string打破这个逻辑。

Question 2

您的文件包含“回车”字符。最好在 Unix 中删除它们。要打印您发布的命令序列（删除回车符），请尝试：

awk '{gsub(/\r/,"")}
     /mod/          { a = $0 }
     /search_string/{ if(a!=""){print(a);a=""}
                      print;getline;print
                    }
    ' infile

或者作为一句单行：

$ awk '{gsub(/\r/,"")}/mod/{a=$0}/search_string/{if(a!=""){print(a);a=""}print;getline;print}' infile

mod start3  
 search_string yada yada  
 hello  
 search_string yada yada  
 bye  
mod start4  
 search_string baba baba  
 this too

由于可以在 (GNU) awk 中使用多字符记录分隔符，我们可以将记录分隔符设置为mod并仅打印包含search_string.需要 printf 来重建原始记录。

要打印您发布为“预期输出”的内容，请尝试：

awk '/search_string/{printf("mod%s", $0)}' RS=mod infile

Answer

您的文件包含“回车”字符。最好在 Unix 中删除它们。要打印您发布的命令序列（删除回车符），请尝试：

awk '{gsub(/\r/,"")}
     /mod/          { a = $0 }
     /search_string/{ if(a!=""){print(a);a=""}
                      print;getline;print
                    }
    ' infile

或者作为一句单行：

$ awk '{gsub(/\r/,"")}/mod/{a=$0}/search_string/{if(a!=""){print(a);a=""}print;getline;print}' infile

mod start3  
 search_string yada yada  
 hello  
 search_string yada yada  
 bye  
mod start4  
 search_string baba baba  
 this too

由于可以在 (GNU) awk 中使用多字符记录分隔符，我们可以将记录分隔符设置为mod并仅打印包含search_string.需要 printf 来重建原始记录。

要打印您发布为“预期输出”的内容，请尝试：

awk '/search_string/{printf("mod%s", $0)}' RS=mod infile

Question 3

如果您想在 Python 脚本中执行此操作：

# Read file into memory.
with open('myfile.txt') as f:
    lines = [line.rstrip() for line in f]

# Loops through lines backwards, looking for string and optionally mod.
output_lines = list()
find_mod = False
for i, line in enumerate(lines[::-1]):
    if 'search_string' in line:
        output_lines.append(lines[::-1][i-1])
        output_lines.append(lines[::-1][i])
        find_mod = True
    elif find_mod and 'mod' in line:
        output_lines.append(lines[::-1][i])
        find_mod=False

print("\n".join(output_lines[::-1]))

Answer

如果您想在 Python 脚本中执行此操作：

# Read file into memory.
with open('myfile.txt') as f:
    lines = [line.rstrip() for line in f]

# Loops through lines backwards, looking for string and optionally mod.
output_lines = list()
find_mod = False
for i, line in enumerate(lines[::-1]):
    if 'search_string' in line:
        output_lines.append(lines[::-1][i-1])
        output_lines.append(lines[::-1][i])
        find_mod = True
    elif find_mod and 'mod' in line:
        output_lines.append(lines[::-1][i])
        find_mod=False

print("\n".join(output_lines[::-1]))

匹配patternA并仅在patternB匹配时打印它，包括以下行

答案1

答案2

答案3

相关内容