我有一个大文件,包含 1000 多个页码跨度类。我想通过 ReGex 删除 notepad++ 中文本的完整语法。例如,<p>Cillacepro di to tem endelias eaquunto maximint eostrum eos dolorit et laboria estiati<span class=”pagenum”><a name=”Page_4” id=”Page_4”>[Pg 4]</a></span>Cillacepro di to tem endelias</p>
我想<span class=”pagenum”><a name=”Page_4” id=”Page_4”>[Pg 4]</a></span>
用“ ”替换,这样它也能找到两位和三位数字的模式。我是这个正则表达式字符串搜索的新手,因此,如果有人能帮我找到一个替换字符串,我将不胜感激。问候,阿曼·米塔尔
答案1
转义方括号并使用数字简写(“/d”)后跟重复符号“+”来匹配页码:
<span class="pagenum"><a name="Page_\d+" id="Page_\d+">\[Pg \d+\]</a></span>
您可以在以下示例代码上验证上述正则表达式:
placeholdertext<span class="pagenum"><a name="Page_4" id="Page_4">[Pg 4]</a></span>placeholdertext
placeholdertext
<span class="pagenum"><a name="Page_111" id="Page_111">[Pg 111]</a></span>
placeholdertext<span class="pagenum"><a name="Page_222" id="Page_222">[Pg 222]</a></span>
答案2
感谢@AFH 提供通用答案,该答案可以满足 Page、Pg 和其他类型的要求。我认为匹配<span class="pagenum">.*?</span>
就足够了,因为只有这个 span 类才可能包含您想要消除的页码数据。请注意,.*? 将匹配最少数量的任意字符,确保匹配中的与相同的前导配对。– AFH 12 小时前
我还要感谢 @alzaj 提供正确的指导。非常感谢!节省了我的时间和精力!问候,Aman Mittal