Grep 日志并获取日志分隔符之间的文本

Question 1

如果您知道记录有多大，那么您可以在匹配行之前 ( -B) 和之后 ( ) 输出额外的上下文行，例如-A

grep -A2 -B2 'Fields' sample.log

或者用于匹配线之前和之后的上下文

grep -C3 'Fields' sample.log

据我所知，在 GNU grep 中执行真正的多行匹配（而不是单行匹配加上下文）的唯一方法是使用 PCRE 正则表达式模式 ( -P) 并带有-z标志以防止换行。例如，您可以尝试

grep -zPo '(\n-+\n)\K(.|\n)+?Fields(.|\n)+?(?=\n-+\n)'

它对由任何字符或换行符包围的字符串进行非贪婪匹配Fields，前提是它由换行符-连字符-换行符分隔符。 pcregrep 中的等效表达式是

pcregrep -Mo '(\n-+\n)\K(.|\n)+?Fields(.|\n)+?(?=\n-+\n)'

这种记录结构数据的另一种选择是 awk：特别是，GNU awk 允许将正则表达式用于内部记录分隔符RS例如

$ gawk -vRS='\n-+\n' '/Fields/ {print}' sample.log

r132279 | USERID | 2014-04-30 12:59:09 -0700 (Wed, 30 Apr 2014) | 3 lines

Removed unused "Calculated Fields" column entry.

Jira ID: JIRA-977

Answer

如果您知道记录有多大，那么您可以在匹配行之前 ( -B) 和之后 ( ) 输出额外的上下文行，例如-A

grep -A2 -B2 'Fields' sample.log