正则表达式从嵌套的 HTML 标签中提取特定文本

正则表达式从嵌套的 HTML 标签中提取特定文本

我有这个文字

<div id="navbar"><a href="../index.php">Final Fantasy Shrine Forums</a> &gt; <a href="./f-90.html">Downloads</a> &gt; <a href="./f-92.html">Film, Television and Classical Music Download Links</a> &gt; Gott Mit Uns - Ennio Morricone (1969) (FLAC)</div>

我想获取此文本

Gott Mit Uns - Ennio Morricone (1969) (FLAC)

我尝试了这个正则表达式,但不匹配 - 我使用 regex101 并设置了 Java8 风格

<div\\s*id=\"navbar\"><a.*</a>\\s*&gt;\\s*(.*?)\\s*</div>

答案1

我假设您想要获取结束 div 之前的文本。

我建议使用以下正则表达式:

.*> &gt; (.*)</div>

您可以在这里测试: https://regex101.com/r/8wgCDG/1

相关内容