我有一个日志文件,我定期在其中附加新的文本块,并以第一行作为标签。所有标签均以 + 开头。块中没有终止模式。每个块可以是 1 行或多行。
+numbers
23
-87
12
+letters
b
w
a
q
+sentences
line of text
another line of text
+numbers
2
34
+address
line1
line2
line3
+numbers
4
87
我想打印以给定标签开头的所有块。例如,对于 +numbers 我想看到:
+numbers
23
-87
12
+numbers
2
34
+numbers
4
87
或者对于+地址:
+address
line1
line2
line3
我可以用 awk 来做到这一点。但我正在寻找 sed 解决方案。
答案1
你可以用一个来做到这一点sed
(这应该适用于任何输入:空行、连续块+numbers
等):
sed -e '/^+/!{H;$!d;}' -e 'x;/^+numbers/!d' logfile
怎么运行的:
sed '/^+/!{ # if a line doesn't start with a + (so, not a tag)
H # append it to hold space and then,
$!d # if it's not the last line, delete it (that is, get a
} # new input line and restart the cycle);
x # otherwise, exchange buffers and
/^+numbers/!d' # if the pattern space doesn't match "^+numbers", delete it
logfile
换句话说,“标记”行在执行时保存在保持缓冲区中,然后在执行x
时附加该块中的其余行。H
当下一个“标记”行进入模式空间(或最后一行)时,缓冲区将再次交换,因此现在模式空间包含整个行块。如果它以以下内容开头,那么这只是自动打印的问题+numbers
答案2
有两个 GNU sed
.
先决条件:您的日志文件不包含任何空行。
sed 's/^+/\n&/' logfile | sed -n '/+numbers/,/^$/{ /^$/d; p }'
输出:
+数字 23 -87 12 +数字 2 34 +数字 4 87
看man sed
答案3
tag=address
sed -n "/^+${tag}/,/^+/ {/^[^+]/p; /^+${tag}/p; }" file
这将要如果文件包含具有相同标记的连续块,则中断。范围的结束正则表达式将消耗下一个块的标签。
作为比较,在这种情况下不会中断的 awk 命令
awk -v tag=address '/^\+/ {p = $0 ~ "\\+" tag "$"} p' file
awk -v tag=numbers -v RS='+' '$1 == tag {printf "+%s", $0}' file