我知道人们在文本编辑器中以纯文本形式编写 LaTeX 代码。然后人们将该文件保存为.tex
文件,并使用 latex(或 pdflatex,或 ...)进行编译。
据我所知,纯文本有多种类型。从技术上讲,tex-code 的纯文本应该写成什么?
答案1
简而言之:这很复杂,但大多数系统都会自动做正确的事情。
中等版本:
“纯文本类型”实际上只有两类差异:行尾和编码。
行尾通常将纯文本文件传输与“二进制”区分开来,因为行尾会转换为平台上使用的格式,通常是这样(在 Windows 上为 #13#10 对,在 Linux/和 OSx 上为 #10 对,在较旧的 Mac 版本上为 #13,较旧的操作系统具有不同的约定,或者基于记录的文件系统根本不使用行尾字符。)
现代 TeX 实现将处理 #13 和 #10 的所有组合,因此即使你在 Linux 机器上有一个 Windows 文件(反之亦然),它也可以工作
另一个区别是编码,即使用什么字节序列来表示每个字母。在这里,您可以使用最常用的编码,但您需要告诉 LaTeX 您使用的是哪种编码,除非您只使用 ascii 字母。
因此,如果您使用 UTF-8(如果您没有特别的理由选择其他代码,那么这是最好的选择),那么您需要
\usepackage[utf8]{inputenc}
在文件中。
如果你使用的是在系统开始转向 Unicode 之前西欧大部分地区使用的 ISO-8859-1(latin-1)编码,那么你需要
\usepackage[latin1]{inputenc}
ETC。
首选 UTF-8,因为它是 Unicode 编码,而不是特定语言或地区的编码。(从本网站复制的示例最初将采用 UTF-8 编码,但如果您将其剪切并粘贴到以不同编码保存的文件中,许多编辑器会自动转换。)
长版本:Unicode 规范。