我注意到,PDF
如果单词中有字母“i”,我的 -files 搜索将不起作用。不过,如果单词中有其他两个特定于字母“є”和“ї”,ukrainian
搜索将正常工作。ukrainian language
正如您在下面看到的,
\input{glyphtounicode}
\pdfgentounicode=1
包含在序言中。
有问题吗babel
?
\documentclass[twoside]{article}
\usepackage[utf8]{inputenc}
\usepackage[T2A,T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage[ukrainian]{babel}
\input{glyphtounicode}
\pdfgentounicode=1
\begin{document}
ііііі\\
ффффф\\
їїїїїї\\
єєєєє
\end{document}
我使用 进行编译miktex's
Pdflatex
。
这个XeLaTeX
问题不会出现。
答案1
T2A 编码理念早于 PDF 和 Unicode 支持;为了节省空间并容纳尽可能多的语言,西里尔小写字母白俄罗斯-乌克兰语 I 及其大写变体使用编码表中的拉丁文 i 和 I 来呈现。
对此我们无能为力glyphtounicode
,因为输出的字母是拉丁字母。
但是,对于支持该功能的 PDF 查看器,accsupp
可以提供帮助:
\input{glyphtounicode}
\pdfgentounicode=1
\documentclass[twoside]{article}
\usepackage[utf8]{inputenc}
\usepackage[T2A,T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage[ukrainian]{babel}
\usepackage{accsupp}
\DeclareTextCommand{\cyrii}{T2A}{%
\BeginAccSupp{method=hex,unicode,ActualText=0456}%
\symbol{105}%
\EndAccSupp{}%
}
\DeclareTextCommand{\CYRII}{T2A}{%
\BeginAccSupp{method=hex,unicode,ActualText=0406}%
\symbol{73}%
\EndAccSupp{}%
}
\begin{document}
ііііі\\
ффффф\\
їїїїїї\\
єєєєє
\end{document}
如果您使用 Adobe Reader 查看输出,第一行将由 U+0456 字符组成。其他 PDF 查看器可能没有必要的功能。