使用 RegEx 查找 UTF8 字符

使用 RegEx 查找 UTF8 字符

我有很多文件(xml、css、js、html)

并希望看到所有具有“UTF-8”字符的人,因为有些文件在,ANSI而其他文件在UTF-8 without BOM

我尝试了几个“RegEx”来查询,例如:

[^\x00-\x7F]或者\X或者\p{L}

  • 在 Sublime-Text 中我使用了++Ctrl和RegExShiftF

  • 在 Notepad++ 中,我使用 RegEx 的“在所有打开的文档中查找全部”

但两者都返回了“UTF-8”和“ANSI”格式的文档。

是否有可能只找到包含 UTF-8 字符或仅像“iso-8859-1”的文档?

答案1

是否有可能只找到包含 UTF-8 字符或仅像“iso-8859-1”的文档?

不,在没有 BOM 的 UTF-8 中这是不可能的。唯一的区别在于如何解释字符,而不是字符本身。

相关内容