使用 RegEx 查找 UTF8 字符

2024-6-16 • tag-icon

我有很多文件（xml、css、js、html）

并希望看到所有具有“UTF-8”字符的人，因为有些文件在，ANSI而其他文件在UTF-8 without BOM。

我尝试了几个“RegEx”来查询，例如：

[^\x00-\x7F]或者\X或者\p{L}

但两者都返回了“UTF-8”和“ANSI”格式的文档。

是否有可能只找到包含 UTF-8 字符或仅像“iso-8859-1”的文档？

是否有可能只找到包含 UTF-8 字符或仅像“iso-8859-1”的文档？

不，在没有 BOM 的 UTF-8 中这是不可能的。唯一的区别在于如何解释字符，而不是字符本身。

相关内容