如何为 pdftex 查找非英国非 ASCII 非 LaTeX 字符？

Question

[\x80-\xFF]仅包括从 128 到 255 的代码点。根据区域设置，特别是字符编码，这可能是也可能不是非 ASCII 字符集。仅在 8 位编码中存在这种情况。（准确地说，基于 ASCII 的 8 位编码，但您极不可能遇到其他任何编码。）在字符不是单个字节的语言环境中，包括事实上的标准 UTF-8，[\x80-\xFF]仅非 ASCII 字符的一小部分。

搜索非 ASCII 字符的最简单方法是强制使用 C 语言环境。在 C 语言环境中，字符是一个字节。使用单字节语言环境还可以使某些版本的 GNU grep 速度显着加快。

LC_ALL=C grep --color='auto' -P -n "[\x80-\xFF]" file.tex

Answer 1

[\x80-\xFF]仅包括从 128 到 255 的代码点。根据区域设置，特别是字符编码，这可能是也可能不是非 ASCII 字符集。仅在 8 位编码中存在这种情况。（准确地说，基于 ASCII 的 8 位编码，但您极不可能遇到其他任何编码。）在字符不是单个字节的语言环境中，包括事实上的标准 UTF-8，[\x80-\xFF]仅非 ASCII 字符的一小部分。

搜索非 ASCII 字符的最简单方法是强制使用 C 语言环境。在 C 语言环境中，字符是一个字节。使用单字节语言环境还可以使某些版本的 GNU grep 速度显着加快。

LC_ALL=C grep --color='auto' -P -n "[\x80-\xFF]" file.tex

如何为 pdftex 查找非英国非 ASCII 非 LaTeX 字符？

工具经过测试，但在吉尔斯之后没有任何好处回答

我不确定的事情

答案1

相关内容