如何使我的非拉丁语 pdflatex 文档更适合复制粘贴？

2024-5-25 • tag-icon

我使用 pdflatex 用不使用拉丁字母的语言编写和排版文章。我收到了外国人的请求，希望能够更轻松地在 Google 翻译中运行文档。据他们说，当他们在查看器中打开我的 pdf 并选择某些部分然后复制粘贴时，文本完全无法阅读。事实上，当我尝试将几句话复制粘贴到记事本时，我看到的是充满字符串àáâãäåæçèéêëìíîï和其他无法阅读的文本。

经过研究，我了解到 LaTeX 中的所有字体都使用代码范围，00-FF因此复制的所有非拉丁文字都会包含与其 unicode 值不对应的代码。是否有任何软件包或技巧可以自动将非 ASCII 字母映射到 unicode？我想让非英语文章更容易被更广泛的受众所接受，并消除技术障碍。非 XeTeX 解决方案尤其受欢迎。

相关内容