正则表达式无法匹配 Notepad++ 中的 UTF-8 字符

正则表达式无法匹配 Notepad++ 中的 UTF-8 字符

假设 Notepad++ 中的 UTF-8 文本如下:

答案1

事实证明,NP++ 在基本多语言平面 (BMP) 之外搜索代码点在\x{10000}\x{10FFFF}之间(大于\x{FFFF})的 Unicode 字符时会遇到问题。

一种解决方法是使用代理对。

显然这是 Boost Regex 的一个限制。

来源:https://community.notepad-plus-plus.org/topic/19990/regexp-fails-to-match-utf-8-characters/

相关内容