T1 fontenc - 文本不可搜索

T1 fontenc - 文本不可搜索

每当我使用 T1 fontenc 时,输出 PDF 的文本都无法搜索。您可以在下面找到 MWE,pdflatex输出这里和日志文件这里

\documentclass{article}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\begin{document}
\section{Hola amigo}
Todo bien
\end{document}

显然,如果我从序言中删除该fontenc包,则文本可毫无问题地进行搜索。

我不知道这是否是与我的 texlive 发行版相关的问题(我在 ArchLinux 上)。

答案1

当您使用 Computer Modern 字体时(我cm-super在您的日志中看到,很好),该包cmap会有所帮助。

另一方面,最好使用拉丁现代字体,并且有glyphtounicode部分内容可供复制/粘贴:

\usepackage{lmodern}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}

\input{glyphtounicode}
\pdfgentounicode=1

T1但是,这里列出的复制/粘贴有一些限制,例如, ĐPDF 中有克罗地亚语,复制它会给你冰岛语Ð(Eth)——不是同一个字符。

有关此事的更多(简单)详细信息请参见此处:https://en.wikipedia.org/wiki/Cork_encoding#Supported_languages

完整的编码定义,包含许多细节和解释:http://www.tug.org/fontname/ec.enc

相关内容