我使用 pdflatex 用不使用拉丁字母的语言编写和排版文章。我收到了外国人的请求,希望能够更轻松地在 Google 翻译中运行文档。据他们说,当他们在查看器中打开我的 pdf 并选择某些部分然后复制粘贴时,文本完全无法阅读。事实上,当我尝试将几句话复制粘贴到记事本时,我看到的是充满字符串àáâãäåæçèéêëìíîï
和其他无法阅读的文本。
经过研究,我了解到 LaTeX 中的所有字体都使用代码范围,00-FF
因此复制的所有非拉丁文字都会包含与其 unicode 值不对应的代码。是否有任何软件包或技巧可以自动将非 ASCII 字母映射到 unicode?我想让非英语文章更容易被更广泛的受众所接受,并消除技术障碍。非 XeTeX 解决方案尤其受欢迎。