我有一个由 生成的 PDF 文件pdflatex
。它包含诸如“第三个也是最后一个原因”之类的文本。当搜索诸如“和最后一个”之类的文本时,xpdf
将不会匹配“fi”。根据我多年(甚至几十年)研究过这个问题的模糊记忆,我认为这是因为“fi”中的“连字符”。由于“f”中的悬垂,也就是说,“fi”被组合成一个符号以允许更近的间距(如果不是重叠字符)。
在我的创作/审阅/修订周期中,当我快速尝试浏览文档以查找段落时,上述情况总是让我感到困惑。LaTeX 纯粹主义者会说我应该浏览源文件,但出于一些我现在不想深入讨论的原因,我经常发现浏览 PDF 更好(并非总是如此)。我的许多使用 LaTeX 的同事也有同样的发现。
有没有什么办法可以解决xpdf
无法找到连字符的问题?
例子
这是一个最小工作示例:
\documentclass{report}
\begin{document}
This is the first and final document.
\end{document}
我可以搜索并查找rst
,但irst
不能first
。
答案1
尝试
\usepackage[T1]{fontenc}
和/或
\input{glyphtounicode}
\pdfgentounicode=1