小型大写字母、旧式数字和一些连字符会在 PDF 复制文本中产生奇怪的符号吗？

Question

关于 PUA 编码的第二个问题的部分答案：

您可以使用删除 PUA 编码ttx，该工具包含在OpenType 的 Adobe 字体开发工具包 (AFDKO)。

然而，新字体（例如 Arno Pro）根本没有针对小型大写字母的 PUA 编码，但编译像您这样的文档仍然会导致小型大写字母无法搜索。因此，Jonathan Kews 提出的观点这里不幸的是，这是错的。错误不是 PUA 编码，而是 XeTeX 生成的错误 cmap。

话虽如此，您在问题中表示，您可以将 LuaTeX 生成的正确 cmap 移植到 XeTeX 生成的错误映射中。也许一种解决方法是为每个可能的字形创建一个正确的 cmap，然后将其用于 XeTeX。当然，这将完全取决于字体（和字体修订），但它应该适合您的私人目的。

不幸的是我无法尝试，因为我不知道如何“移植” cmap。你能详细说明一下你是怎么做到的吗？

编辑：我刚刚意识到一切都完美地Junicode和EB 加拉蒙德（当您单独指定 SC 字体时），即类似于：

\documentclass{article}

\usepackage{fontspec}
\setmainfont{Junicode}

\begin{document}

{\addfontfeature{Letters=UppercaseSmallCaps}DIE STRAßE IST ZU SCHMAL FÜR AUTOS.

{\addfontfeatures{Numbers=OldStyle}12345}

\end{document}

与可搜索 PDF 完美编译。也许我放弃尝试去理解发生了什么……

Answer 1