如何使用 Source Han 从 PDF 复制/粘贴中获取正确的内容?

如何使用 Source Han 从 PDF 复制/粘贴中获取正确的内容?

我安装了“特定语言 OTF”版本的 Source Han SansAdobe Font 的发布页面例如SourceHanSansSC-Regular.otf,它设置了适合简体中文惯例的默认表意文字,但仍然提供“完整的字符覆盖或对语言标记文本使用适合其他语言的字形的能力”。

当我通过创建 PDF 时

\documentclass{article}
\usepackage{fontspec}
\setmainfont{SourceHanSansSC-Regular.otf}
\newcommand\test{\char"8FD4 E567F\par}
\begin{document}
\test
\addfontfeatures{Script=CJK Ideographic,Language=Chinese Simplified}
\test
\addfontfeatures{Script=CJK Ideographic,Language=Chinese Traditional}
\test
\addfontfeatures{Script=CJK Ideographic,Language=Chinese Hong Kong}
\test
\addfontfeatures{Script=CJK Ideographic,Language=Japanese}
\test
\addfontfeatures{Script=CJK Ideographic,Language=Korean}
\test
\end{document}

输出看起来很好,表意文字U+8FD4有五种不同的形式。另外,请注意,拉丁/默认脚本中的数字高度略低于大写字母高度,而 CJK 脚本中的两者相等。这是不同脚本中理想的设计。

源黑体测试

但是从 PDF 复制/粘贴有问题:

From XeLaTeX    From LuaLaTeX
返E

相关内容