在 Notepad++ 中通过正则表达式删除 span 类

在 Notepad++ 中通过正则表达式删除 span 类

我有一个大文件,包含 1000 多个页码跨度类。我想通过 ReGex 删除 notepad++ 中文本的完整语法。例如,<p>Cillacepro di to tem endelias eaquunto maximint eostrum eos dolorit et laboria estiati<span class=”pagenum”><a name=”Page_4” id=”Page_4”>[Pg 4]</a></span>Cillacepro di to tem endelias</p>

我想<span class=”pagenum”><a name=”Page_4” id=”Page_4”>[Pg 4]</a></span>用“ ”替换,这样它也能找到两位和三位数字的模式。我是这个正则表达式字符串搜索的新手,因此,如果有人能帮我找到一个替换字符串,我将不胜感激。问候,阿曼·米塔尔

答案1

转义方括号并使用数字简写(“/d”)后跟重复符号“+”来匹配页码:

<span class="pagenum"><a name="Page_\d+" id="Page_\d+">\[Pg \d+\]</a></span>

您可以在以下示例代码上验证上述正则表达式:

placeholdertext<span class="pagenum"><a name="Page_4" id="Page_4">[Pg 4]</a></span>placeholdertext
placeholdertext
<span class="pagenum"><a name="Page_111" id="Page_111">[Pg 111]</a></span>
placeholdertext<span class="pagenum"><a name="Page_222" id="Page_222">[Pg 222]</a></span>

答案2

感谢@AFH 提供通用答案,该答案可以满足 Page、Pg 和其他类型的要求。我认为匹配<span class="pagenum">.*?</span>就足够了,因为只有这个 span 类才可能包含您想要消除的页码数据。请注意,.*? 将匹配最少数量的任意字符,确保匹配中的与相同的前导配对。– AFH 12 小时前

我还要感谢 @alzaj 提供正确的指导。非常感谢!节省了我的时间和精力!问候,Aman Mittal

相关内容