考虑以下 MWE:
\documentclass{article}
\usepackage{lmodern}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage[croatian]{babel}
\input{glyphtounicode} % *
\pdfgentounicode=1 % **
\begin{document}
A B C Č Ć D DŽ Đ \dots
\end{document}
从 Adobe Reader 复制/粘贴得到A(0x41) B(0x42) C(0x43) Č(0xC48C) Ć(0xC486) D(0x44) DŽ(0x44 0xC5BD) Ð(0xC390) .(0x2E) .(0x2E) .(0x2E)
(UTF-8)。
我知道这个 MWE 中 T1 的缺点:
- 没有为
ETH
和提供单独的插槽D WITH STROKE
,因此我得到ETH
(0xC390
):https://tex.stackexchange.com/a/569460/115879 - 没有专门用于克罗地亚语二合字母的插槽,因此必须将它们排版为两个单独的字符(它们实际上是在源代码中以这种方式输入的,使用
DŽ
和其他字符会产生错误) - 由于没有专门用于省略号的位置,因此我得到了
FULL STOP
三次。
在下列情况下将使用哪些映射(请参阅分发/包中的文件):
*
被评论**
被评论- 和
*
都有**
评论吗?
编辑。根据 David Carlisle 的评论,我稍微改变了一下问题:有人能说出五年前glyphtounicode
没有自动输入时发生了什么吗?
谢谢!