答案1
您使用的字体确实有误导性的字形名称,因此没有很好的自动化解决方案,但您可以使用逐个字符显式覆盖映射\pdfglyphtounicode
。 在您的例子中,您只需要 tfm 文件生成的字体tipa10.tfm
,并希望将名为“at”的字形映射到 Unicode 代码点 U+0259,因此这转换为
\pdfglyphtounicode{tfm:tipa10/at}{0259}
这可以添加到文档序言中的任何位置,这样您就可以
\documentclass{book}
\usepackage[T1]{fontenc}
\usepackage{tipa}
\pdfglyphtounicode{tfm:tipa10/at}{0259}
\begin{document}
\textschwa
\end{document}
答案2
如果可能的话,你应该加载支持 LuaTeX 或 XeTeX 中 IPA 符号的字体。在这个例子中,我使用了 New Computer Modern Book。其他字体包括 Libertinus、dejaVu 和 Charis SIL。文本复制并粘贴为əə
。
\documentclass{book}
\usepackage{newcomputermodern}
\DeclareTextSymbol{\textschwa}{TU}{"0259}
% Only needed if you are mixing in 8-bit fonts:
%\DeclareTextSymbolDefault{\textschwa}{TU}
\begin{document}
ə{\textschwa}
\end{document}
您还可以使用tipauni
,这应该更简单。(不要与混淆unitipa
。)
如果你保存的独立 PDF 仅包含一个中元音,你可以将此 PDF 文件包含在 PDFTeX 文档中获得一个可以复制和搜索的 Unicode 中字符。您可能还想让 Unicode 字符ə
运行此命令,使用newunicodechar
。
如果您确实需要扩展 PDFLaTeX 以支持tipa
并使结果副本作为有效的 Unicode,那么您要做的就是扩展mmap
以支持使用的 8 位 T3 编码tipa
。