删除 HTML 文件中除第一行之外的所有文本行？

Question

您可以尝试以下 perl 单行代码：

perl -0777 -ne 'm#(^.*?<p>.*?</p>.*?\n).*</p>.*?\n(.*)$#s; print $1, $2' <file>

例如，如果你有test包含以下内容的文件

<blockquote><br>
<p>text1</p><br>
**<img...<br>
<p>text2</p><br>
...<br>
<p>text(n)</p>**
appendix

然后你用上面提到的一行代码来处理它

<blockquote><br>
<p>text1</p><br>
appendix

结果显示在屏幕上。

Answer 1

您可以尝试以下 perl 单行代码：

perl -0777 -ne 'm#(^.*?<p>.*?</p>.*?\n).*</p>.*?\n(.*)$#s; print $1, $2' <file>

例如，如果你有test包含以下内容的文件

<blockquote><br>
<p>text1</p><br>
**<img...<br>
<p>text2</p><br>
...<br>
<p>text(n)</p>**
appendix

然后你用上面提到的一行代码来处理它

<blockquote><br>
<p>text1</p><br>
appendix

结果显示在屏幕上。

相关内容