匹配特定行并打印除以下行之外的所有行

Question 1

sed有了基础知识，这个问题就不难理解了：

sed '/<doc>/{n;/<\/s>/d;}'

对于带有的行<doc>，打印它并用读取下一行n，然后，如果下面的行包含</s>（斜线需要转义），则用删除它d。

更详细的解释：/expression/{command;command;...;}意味着仅在与模式匹配的行上执行命令，因此所有其他行都会按原样打印，而对于该<doc>行，n则会执行。该命令打印当前行并读取下一行，因此以下命令将在下一行执行。这里又出现了另一个d带有“地址”( ) 的命令 ( )，因此只有包含的/<\/s>/行才会被删除，否则将被打印。无论哪种情况，脚本都会继续执行以下行。d</s>

Answer

sed有了基础知识，这个问题就不难理解了：

sed '/<doc>/{n;/<\/s>/d;}'

对于带有的行<doc>，打印它并用读取下一行n，然后，如果下面的行包含</s>（斜线需要转义），则用删除它d。

更详细的解释：/expression/{command;command;...;}意味着仅在与模式匹配的行上执行命令，因此所有其他行都会按原样打印，而对于该<doc>行，n则会执行。该命令打印当前行并读取下一行，因此以下命令将在下一行执行。这里又出现了另一个d带有“地址”( ) 的命令 ( )，因此只有包含的/<\/s>/行才会被删除，否则将被打印。无论哪种情况，脚本都会继续执行以下行。d</s>

Question 2

使用 GNU sed：

sed -z -i 's:<doc>\n</s>:<doc>:g' infile.txt

这将<doc>后面的替换</s>为 only <doc>。sed's标志-i用于就地替换；并且该g标志将替换全部的发生。-z导致用 NULL 字符分隔行。

Answer

使用 GNU sed：

sed -z -i 's:<doc>\n</s>:<doc>:g' infile.txt

这将<doc>后面的替换</s>为 only <doc>。sed's标志-i用于就地替换；并且该g标志将替换全部的发生。-z导致用 NULL 字符分隔行。

Question 3

正如你所标记的，shell_script我建议awk方法：

awk '/^<doc>/ && getline nl > 0 && nl!~/^<\/s>/{ print $0 RS nl }1' file

输出：

<doc>
<s>
Bla
bla
bla
.
</s>
<s>
Bla
bla
bla
.
</s>
</doc>
<doc>
...

Answer

正如你所标记的，shell_script我建议awk方法：

awk '/^<doc>/ && getline nl > 0 && nl!~/^<\/s>/{ print $0 RS nl }1' file

输出：

<doc>
<s>
Bla
bla
bla
.
</s>
<s>
Bla
bla
bla
.
</s>
</doc>
<doc>
...

匹配特定行并打印除以下行之外的所有行

答案1

答案2

答案3

相关内容