我有这个文本,来自许多其他具有相同格式和链接的 html,只有文本不同。我想提取文本的这一部分:“广阔的理想本质”。基本上,在使用正则表达式找到此文本后,我需要在搜索结果中看到该词。
...<br><br>The message that an artist emphasizes in his personal work is <a href="https://mywebsite.com/zh/how-are-you.html">the ideal hypostasis of a vast expanse<img src="ru.jpg"</a> that includes the space between himself and the components of the surrounding world.<en>
所以我用这个公式做了一个正则表达式FIRST-PART.*?SECOND-PART
寻找: <a href="https://mywebsite.com/zh/how-are-you.html">.*?<img src="ru.jpg"</a>
我的正则表达式的问题是,结果显示了所有行,但我只需要显示文本:the ideal hypostasis of a vast expanse
答案1
使用以下内容:
- Ctrl+H
- 找什么:
(?s)(?<=FIRST-PART).*?(?=SECOND-PART)
或者
找什么:
(?s)(?<=FIRST-PART)\K(.*?)(?=SECOND-PART)|\1
查看 相符
查看 环绕
查看 正则表达式
对于你的情况,找到他的:
(?s)(?<= <a href="https://mywebsite.com/zh/how-are-you.html">).*?(?=<img src="ru.jpg"</a>)