答案1
Unicode、字符集和字体混合问题。
似乎你对混合原始文档中的unicode / charset / font。
希腊字符不在 ASCII 表的前 127 位
。统一码标准[1]你应该在以下范围内找到它们0370-03FF
[2]。例如字母 alpha 是 unicodeU+03B1
[3]。作为参考,它遵循 ISO/IEC_8859-7 标准[4]来自微软的一个名为Windows-28597。
问题是,甚至存在一种字体(或多种字体)将 写为a
,α
并保留相同的内部代码(97)。例如象征是所有基于 PostScript 的打印机上可用的四种标准字体之一(在 latex 文档和 pdf 文档中也是如此),由 adobe 创建,其内部表示形式与 unicode 不同[5]:
Symbol α β γ δ ε ζ η θ ι κ λ μ
Symbol* a b g d e z h q i k l m
Symbol ν ξ ο π ρ ς σ τ υ φ χ ψ ω
Symbol* n x o p r V s t u f c y w
*encoded as ASCII for older versions of the font
查看不同字体的渲染此维基页面。
但是,此字体仅包含完整的无重音希腊字母。因此,当文档中混合了不同的字体和字符集时,可能会发生这种情况,而翻译某些东西丢失了,最终你得到的是一种混合的表现形式。
更多参考资料