我有一份使用罗马尼亚语、带变音符号的文档。它是使用 TexWorks 创建的。我的文档如下所示:
\usepackage[utf8]{inputenc}
\usepackage[romanian]{babel}
ca răspuns la anunțul dumneavoastră
在 PDF 阅读器中查看时看起来不错。当我尝试将文本从 PDF 复制到记事本时,它输出:
ca r˘ aspuns la anunt , ul
这是复制的,而不是原始输入。有人能解释一下为什么会这样吗?
答案1
恐怕目前还没有完全支持罗马尼亚语的字体编码。应该创建新字体:不是从头开始,但这将是一项艰巨的工作,而且无论如何你也不会有很多可用的字体。
问题在于,在标准编码中OT1
,没有重音字母;T1
情况稍微好一些,因为ÂâÎîĂă
作为预组合字符存在,但ȘșȚț
不是,所以必须从其他部分构建它们。
这会带来两个不良后果:罗马尼亚语单词无法正确连字符,ȘșȚț
并且无法安全地从 PDF 中复制字符。该软件包提供了一种不太容易的复制解决方法accsupp
,但它仅适用于 Adobe Acrobat,据我所知,没有其他查看器可以使用。
T1
不幸的是,编码不足以ŞşŢţ
满足罗马尼亚语的印刷要求。原因在于历史:当T1
决定编码时,很容易添加对土耳其语的支持,并且语言已经Şş
;添加了带有变音符的“t”(在我看来,这从一开始就是错误的)。
使用 XeLaTeX/LuaLaTeX 时情况会好得多:许多字体都支持罗马尼亚语字母ŞşŢţ
以及其他字母。以下是使用 XeLaTeX/LuaLaTeX 开箱即用的功能:
\documentclass{article}
\usepackage[romanian]{babel}
\usepackage{fontspec}
\begin{document}
ca răspuns la anunțul dumneavoastră
\end{document}
从 PDF 复制粘贴即可
ca răspuns la anunțul dumneavoastră