无法从最简单的 PDF 文件中复制文本？

Question 1

基于字体编码的 Unicode 映射

根据使用的 TeX 编码将字形转换为 Unicode 的信息打包cmap或mmap添加到 PDF 文件中。这些钩子嵌入到 LaTeX 的字体加载机制中，应尽早使用，例如：

\RequirePackage{mmap}% (\usepackage does not work before \documentclass)
\documentclass{article}

mmap这里使用包，因为据我所知它具有更好的数学支持。

另一种方法是使用 pdfTeX 的功能，该功能根据字体中的字形名称添加 Unicode 映射。因此，它不适用于 PK 字体，因为它们不包含字形名称。

\pdfgentounicode=1 %    
\input{glyphtounicode}

注意：包cmap或mmap不能与一起使用\pdfgentounicode。结果将是字体数据字典中的重复条目。这在PDF 规范：

注意：同一本词典中的两个条目不应具有相同的键。如果某个键出现多次，则其值未定义。

复制和粘贴是否产生随机结果取决于 PDF 查看器。

尤其是如果您有重音字符或更多特殊符号，您应该考虑使用T1字体编码。LaTeX 的默认编码OT1仅支持 7 位（最多 128 个字形）。重音字符是构造的，这不利于复制和粘贴：

\usepackage[T1]{fontenc}

您应该已经安装了cm-super包含 Type 1 版 EC 字体的字体包。或者使用现代 Latin Modern 字体。它们源自 CM/EC 字体。

\usepackage[T1]{fontenc}
\usepackage{lmodern}

Answer