utf8 inputenc 中哪些 UTF-8 字符有效/无效?

utf8 inputenc 中哪些 UTF-8 字符有效/无效?

我正在编写一个 Python 程序,用于读取一些文本文件并将数据写入一些 TeX 文件。不幸的是,TeX 编译停止于

Package inputenc Error: Unicode char \u8:´é« not set up for use with LaTeX.

以及其他角色。

是否有一个列表或算法可以告诉我必须过滤掉哪些 UTF-8 字符?

相关内容