如果不使用 glyphtounicode/pdfgentounicode,则使用哪些映射

如果不使用 glyphtounicode/pdfgentounicode,则使用哪些映射

考虑以下 MWE:

\documentclass{article}

\usepackage{lmodern}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage[croatian]{babel}

\input{glyphtounicode} % *
\pdfgentounicode=1     % **


\begin{document}

A B C Č Ć D DŽ Đ \dots

\end{document}

从 Adob​​e Reader 复制/粘贴得到A(0x41) B(0x42) C(0x43) Č(0xC48C) Ć(0xC486) D(0x44) DŽ(0x44 0xC5BD) Ð(0xC390) .(0x2E) .(0x2E) .(0x2E)(UTF-8)。

我知道这个 MWE 中 T1 的缺点:

  • 没有为ETH和提供单独的插槽D WITH STROKE,因此我得到ETH( 0xC390):https://tex.stackexchange.com/a/569460/115879
  • 没有专门用于克罗地亚语二合字母的插槽,因此必须将它们排版为两个单独的字符(它们实际上是在源代码中以这种方式输入的,使用DŽ和其他字符会产生错误)
  • 由于没有专门用于省略号的位置,因此我得到了FULL STOP三次。

在下列情况下将使用哪些映射(请参阅分发/包中的文件):

  1. *被评论
  2. **被评论
  3. *都有**评论吗?

编辑。根据 David Carlisle 的评论,我稍微改变了一下问题:有人能说出五年前glyphtounicode没有自动输入时发生了什么吗?

谢谢!

相关内容