Outlook 到 PDF 语言字符转换错误

Outlook 到 PDF 语言字符转换错误

我有 Adob​​e Acrobat dc 试用版和 Windows 8.1。

当我尝试Convert to Adobe PDF从 Outlook 2010 发送包含希腊字符的电子邮件时,一些希腊字符会更改为拉丁字符。

在此处输入图片描述

转换前的右侧文本 -> Καλημέρα藝術本身

转换后文本错误 -> Κaληµέρapaιdιά tι κάνete

在转换过程中,希腊字符和拉丁字符同时存在。

答案1

Unicode、字符集和字体混合问题。

似乎你对混合原始文档中的unicode / charset / font。

希腊字符不在 ASCII 表的前 127 位
统一码标准[1]你应该在以下范围内找到它们0370-03FF [2]。例如字母 alpha 是 unicodeU+03B1 [3]。作为参考,它遵循 ISO/IEC_8859-7 标准[4]来自微软的一个名为Windows-28597。

问题是,甚至存在一种字体(或多种字体)将 写为aα并保留相同的内部代码(97)。例如象征是所有基于 PostScript 的打印机上可用的四种标准字体之一(在 latex 文档和 pdf 文档中也是如此),由 adobe 创建,其内部表示形式与 unicode 不同[5]

Symbol    α     β   γ   δ   ε   ζ   η   θ   ι   κ   λ   μ 
Symbol*   a     b   g   d   e   z   h   q   i   k   l   m
Symbol    ν     ξ   ο   π   ρ   ς   σ   τ   υ   φ   χ   ψ   ω
Symbol*   n     x   o   p   r   V   s   t   u   f   c   y   w
*encoded as ASCII for older versions of the font 

查看不同字体的渲染此维基页面

但是,此字体仅包含完整的无重音希腊字母。因此,当文档中混合了不同的字体和字符集时,可能会发生这种情况,而翻译某些东西丢失了,最终你得到的是一种混合的表现形式。

更多参考资料

相关内容