如何更改 .tex 文件的输入编码系统(最好为 UTF-8)?

如何更改 .tex 文件的输入编码系统(最好为 UTF-8)?

我一直在尝试使用文件中嵌入的连字符模式dehyphtex.tex,该文件是软件包的一部分hyphen-german。不幸的是,该文件似乎在既不是 UTF-8 也不是 ASCII 的系统中编码。文件中列出的数百个单词包含呈现为的字符(大部分是带有 Umlaute 的元音,但也包括带有尖音符的 e 和其他字符)。使用 MacTeX2012,我使用 TeXworks 作为编辑器;此编辑器使用 UTF8 作为默认输入编码方案。到目前为止,使用此编辑器熟悉的几十种备选输入编码方案重新加载文件的反复试验方法均未成功。

我想我可以手动编辑文件以将所有实例替换为正确的 UTF8 编码字符,但我希望有一种更自动化的方法来实现这一点。有谁知道这个文件使用了哪种输入编码方案,以及/或者有谁知道一种方便的方法可以将未知输入编码的文件转换为 UTF8 编码的文件?

答案1

它是 latin1 或 latin9 编码,与 ISO 8859-1 或 15 相同。使用命令recode或者iconv您可以更改它:

recode --diacritics --touch --verbose latin1..UTF-8 <file>

或者

iconv -f LATIN1 -t UTF-8 inputfile.tex > outputfile.tex

相关内容