乳胶代码应该是什么类型的纯文本?

乳胶代码应该是什么类型的纯文本?

我知道人们在文本编辑器中以纯文本形式编写 LaTeX 代码。然后人们将该文件保存为.tex文件,并使用 latex(或 pdflatex,或 ...)进行编译。

据我所知,纯文本有多种类型。从技术上讲,tex-code 的纯文本应该写成什么?

答案1

简而言之:这很复杂,但大多数系统都会自动做正确的事情。


中等版本:

“纯文本类型”实际上只有两类差异:行尾和编码。

行尾通常将纯文本文件传输与“二进制”区分开来,因为行尾会转换为平台上使用的格式,通常是这样(在 Windows 上为 #13#10 对,在 Linux/和 OSx 上为 #10 对,在较旧的 Mac 版本上为 #13,较旧的操作系统具有不同的约定,或者基于记录的文件系统根本不使用行尾字符。)

现代 TeX 实现将处理 #13 和 #10 的所有组合,因此即使你在 Linux 机器上有一个 Windows 文件(反之亦然),它也可以工作

另一个区别是编码,即使用什么字节序列来表示每个字母。在这里,您可以使用最常用的编码,但您需要告诉 LaTeX 您使用的是哪种编码,除非您只使用 ascii 字母。

因此,如果您使用 UTF-8(如果您没有特别的理由选择其他代码,那么这是最好的选择),那么您需要

\usepackage[utf8]{inputenc}

在文件中。

如果你使用的是在系统开始转向 Unicode 之前西欧大部分地区使用的 ISO-8859-1(latin-1)编码,那么你需要

\usepackage[latin1]{inputenc}

ETC。

首选 UTF-8,因为它是 Unicode 编码,而不是特定语言或地区的编码。(从本网站复制的示例最初将采用 UTF-8 编码,但如果您将其剪切并粘贴到以不同编码保存的文件中,许多编辑器会自动转换。)


长版本:Unicode 规范。

相关内容