在 pdf 和 babel 中搜索

在 pdf 和 babel 中搜索

我注意到,PDF如果单词中有字母“i”,我的 -files 搜索将不起作用。不过,如果单词中有其他两个特定于字母“є”和“ї”,ukrainian 搜索将正常工作。ukrainian language

正如您在下面看到的,

\input{glyphtounicode}
\pdfgentounicode=1

包含在序言中。

有问题吗babel

\documentclass[twoside]{article}
\usepackage[utf8]{inputenc}
\usepackage[T2A,T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage[ukrainian]{babel}
\input{glyphtounicode}
\pdfgentounicode=1
\begin{document}
ііііі\\
ффффф\\
їїїїїї\\
єєєєє
\end{document}

我使用 进行编译miktex's Pdflatex

这个XeLaTeX问题不会出现。


答案1

T2A 编码理念早于 PDF 和 Unicode 支持;为了节省空间并容纳尽可能多的语言,西里尔小写字母白俄罗斯-乌克兰语 I 及其大写变体使用编码表中的拉丁文 i 和 I 来呈现。

对此我们无能为力glyphtounicode,因为输出的字母拉丁字母。

但是,对于支持该功能的 PDF 查看器,accsupp可以提供帮助:

\input{glyphtounicode}
\pdfgentounicode=1
\documentclass[twoside]{article}
\usepackage[utf8]{inputenc}
\usepackage[T2A,T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage[ukrainian]{babel}
\usepackage{accsupp}

\DeclareTextCommand{\cyrii}{T2A}{%
  \BeginAccSupp{method=hex,unicode,ActualText=0456}%
  \symbol{105}%
  \EndAccSupp{}%
}
\DeclareTextCommand{\CYRII}{T2A}{%
  \BeginAccSupp{method=hex,unicode,ActualText=0406}%
  \symbol{73}%
  \EndAccSupp{}%
}


\begin{document}
ііііі\\
ффффф\\
їїїїїї\\
єєєєє
\end{document}

如果您使用 Adob​​e Reader 查看输出,第一行将由 U+0456 字符组成。其他 PDF 查看器可能没有必要的功能。

相关内容