删除括号之间的文本，但不要超过空行

Question 1

尝试 awk 的段落模式：

$ awk -v RS= -v ORS='\n\n' '{gsub(/<[^>]+>?\n?/, "")}1' ip.txt 
This is the first
block of text.

This is the second block.


do not delete this>
Third block here.

-v RS=这将导致一个或多个连续的空行被用作输入记录分隔符
-v ORS='\n\n'将输出记录分隔符设置为两个换行符
gsub(/<[^>]+>?\n?/, "")删除<后跟非>字符，后跟可选>字符和换行符
1打印输入记录内容的惯用方法

同样的事情与perl

perl -00 -lpe 'BEGIN{$\="\n\n"} s/<[^>]+>?\n?//g' ip.txt

Answer

尝试 awk 的段落模式：

$ awk -v RS= -v ORS='\n\n' '{gsub(/<[^>]+>?\n?/, "")}1' ip.txt 
This is the first
block of text.

This is the second block.


do not delete this>
Third block here.

-v RS=这将导致一个或多个连续的空行被用作输入记录分隔符
-v ORS='\n\n'将输出记录分隔符设置为两个换行符
gsub(/<[^>]+>?\n?/, "")删除<后跟非>字符，后跟可选>字符和换行符
1打印输入记录内容的惯用方法

同样的事情与perl

perl -00 -lpe 'BEGIN{$\="\n\n"} s/<[^>]+>?\n?//g' ip.txt

Question 2

GNUAwk解决方案：

awk -v RS='[<>]' '/\n\n/{ sub(/^[^\n]+\n/, ""); print $0 RT }' file

RS='[<>]'- 将<和>视为记录分隔符
/\n\n/- 如果当前记录包含 2 个换行符：
- sub(/^[^\n]+\n/, "")- 删除所有内容，直到第一个换行符（包括）
- print $0 RT- 打印当前记录，后跟RT（即>）
- RT- 记录终结者。Gawk设置RT为与指定的字符或正则表达式匹配的输入文本RS。

输出：

<empty line>   
don't delete this>

Answer

GNUAwk解决方案：

awk -v RS='[<>]' '/\n\n/{ sub(/^[^\n]+\n/, ""); print $0 RT }' file

RS='[<>]'- 将<和>视为记录分隔符
/\n\n/- 如果当前记录包含 2 个换行符：
- sub(/^[^\n]+\n/, "")- 删除所有内容，直到第一个换行符（包括）
- print $0 RT- 打印当前记录，后跟RT（即>）
- RT- 记录终结者。Gawk设置RT为与指定的字符或正则表达式匹配的输入文本RS。

输出：

<empty line>   
don't delete this>

删除括号之间的文本，但不要超过空行

答案1

答案2

相关内容