使用 perl 或 grep 复制文本文件中的特定文本

Question

您可能应该为此使用真正的标记解析器，但是至少将格式描述解释为

<page line one
line two /page>
<page line three
line four /page>
<page line five
line six /page>

那么如果快速的awk解决方案¹是可以接受的，你可以这样做

awk -v pagenum=2 'BEGIN {RS="/page>"; ORS=RS} FNR==pagenum {print} 1' file

或者，不那么神秘

awk -v pagenum=2 'BEGIN {RS="/page>"; ORS=RS}; FNR==pagenum {print}; {print}' file

其中您希望复制的页码是通过参数从 shell 传递的-v pagenum=。

如果最后一个标签后面有“stuff”，/page>上面的表达式可能会将其视为不完整的记录，并添加一个虚假的结束/page>记录分隔符。在这种情况下，以下修改后的表达式可能效果更好

awk -v pagenum=2 'BEGIN {RS="/page>"; ORS=""; OFS=""} FNR==pagenum {print $0,RT} {print $0,RT}' file

Answer 1

您可能应该为此使用真正的标记解析器，但是至少将格式描述解释为

<page line one
line two /page>
<page line three
line four /page>
<page line five
line six /page>

那么如果快速的awk解决方案¹是可以接受的，你可以这样做

awk -v pagenum=2 'BEGIN {RS="/page>"; ORS=RS} FNR==pagenum {print} 1' file

或者，不那么神秘

awk -v pagenum=2 'BEGIN {RS="/page>"; ORS=RS}; FNR==pagenum {print}; {print}' file

其中您希望复制的页码是通过参数从 shell 传递的-v pagenum=。

如果最后一个标签后面有“stuff”，/page>上面的表达式可能会将其视为不完整的记录，并添加一个虚假的结束/page>记录分隔符。在这种情况下，以下修改后的表达式可能效果更好

awk -v pagenum=2 'BEGIN {RS="/page>"; ORS=""; OFS=""} FNR==pagenum {print $0,RT} {print $0,RT}' file

相关内容