罗马尼亚语文档中的变音符号问题

罗马尼亚语文档中的变音符号问题

我有一份使用罗马尼亚语、带变音符号的文档。它是使用 TexWorks 创建的。我的文档如下所示:

\usepackage[utf8]{inputenc}
\usepackage[romanian]{babel}

ca răspuns la anunțul dumneavoastră

在 PDF 阅读器中查看时看起来不错。当我尝试将文本从 PDF 复制到记事本时,它输出:

ca r˘ aspuns la anunt , ul

这是复制的,而不是原始输入。有人能解释一下为什么会这样吗?

答案1

恐怕目前还没有完全支持罗马尼亚语的字体编码。应该创建新字体:不是从头开始,但这将是一项艰巨的工作,而且无论如何你也不会有很多可用的字体。

问题在于,在标准编码中OT1,没有重音字母;T1情况稍微好一些,因为ÂâÎîĂă作为预组合字符存在,但ȘșȚț不是,所以必须从其他部分构建它们。

这会带来两个不良后果:罗马尼亚语单词无法正确连字符,ȘșȚț并且无法安全地从 PDF 中复制字符。该软件包提供了一种不太容易的复制解决方法accsupp,但它仅适用于 Adob​​e Acrobat,据我所知,没有其他查看器可以使用。

T1不幸的是,编码不足以ŞşŢţ满足罗马尼亚语的印刷要求。原因在于历史:当T1决定编码时,很容易添加对土耳其语的支持,并且语言已经Şş;添加了带有变音符的“t”(在我看来,这从一开始就是错误的)。

使用 XeLaTeX/LuaLaTeX 时情况会好得多:许多字体都支持罗马尼亚语字母ŞşŢţ以及其他字母。以下是使用 XeLaTeX/LuaLaTeX 开箱即用的功能:

\documentclass{article}
\usepackage[romanian]{babel}
\usepackage{fontspec}

\begin{document}

ca răspuns la anunțul dumneavoastră

\end{document}

在此处输入图片描述

从 PDF 复制粘贴即可

ca răspuns la anunțul dumneavoastră

相关内容