假设 Notepad++ 中的 UTF-8 文本如下:
答案1
事实证明,NP++ 在基本多语言平面 (BMP) 之外搜索代码点在\x{10000}
和\x{10FFFF}
之间(大于\x{FFFF}
)的 Unicode 字符时会遇到问题。
一种解决方法是使用代理对。
显然这是 Boost Regex 的一个限制。
来源:https://community.notepad-plus-plus.org/topic/19990/regexp-fails-to-match-utf-8-characters/