我想在文本文件中查找特殊字符。已知 UTF-8 编码的文件包含
Chinese characters ,
"-",
"^A"(control-A, which is one of special characters),
numbers,
alphabets, and
some other characters. <- This is what I want to find out.
我正在 Linux 中使用 Vim 来查找其他特殊字符。
我用了
/[^^A0-9a-zA-Z-]
找到,但这也会显示中文字符。如何过滤中文字符并仅显示文件中的其他特殊字符?
答案1
Unicode 代码点范围中日韩统一表意文字是0x4E00-0x9FFF
;您必须从[...]
集合中排除该范围的字符(可能使用\%uNNNN
正则表达式原子)。
很遗憾,Vim 目前无法搜索大于 256 个字符的范围,因此您必须合并多个集合([...]\|[...]\|[...]\|...
),或选择其他方法。