即使选中文本也不可见（在 Evince 中）

Question 1

该accsupp包允许排版文本与复制/粘贴文本不同。请参阅补充作为替代方案。

\documentclass{article}
\usepackage{accsupp}
\newcommand\nosee[1]{%
  \BeginAccSupp{method=escape,ActualText={\detokenize{#1}}}%
[\phantom{#1}]%
\EndAccSupp{}%
}
\begin{document}
Now you see me\nosee{, now you don't}.
\end{document}

PDF 视觉输出是

如果我按 Ctl-A、Ctl-C 复制整个文档内容并粘贴，则生成的文本是

Now you see me, now you don't .

后面这段文本是可搜索的。我现在分配了与不可见文本相等的括号空间。如果你在括号之间突出显示，文本是可标记的，但只有在全也就是说，要么突出显示整个隐藏文本，要么不突出显示任何文本。目前的方法不允许突出显示隐藏文本的一部分。

补充

在这里，我使用分别tokcycle处理\invisible输入流的每个标记\nosee，从而允许部分/连续文本突出显示。这里的缺点是环境适用于纯文本，任何宏都只会被分解为剪切/粘贴输出。

这种方法还有提供换行的额外优势。

不再需要对输出进行括号分隔...我改为\textunderscore对遇到的每个字符或空格输出白色。

\documentclass{article}
\usepackage[T1]{fontenc}
\usepackage{accsupp,xcolor,lmodern,tokcycle}
\newcommand\nosee[1]{%
  \sbox0{\detokenize{#1}}%
  \BeginAccSupp{method=escape,ActualText={\detokenize{#1}}}%
\makebox[\wd0]{\textcolor{white}{\textunderscore}}\allowbreak%
\EndAccSupp{}%
}
\tokcycleenvironment\invisible
{\addcytoks{\nosee{##1}}}
{\processtoks{##1}}
{\addcytoks{\nosee{##1}}}
{\addcytoks{\nosee{ }}}
\begin{document}
Now you see me\invisible , now you don't\endinvisible.
\end{document}

Answer

该accsupp包允许排版文本与复制/粘贴文本不同。请参阅补充作为替代方案。

\documentclass{article}
\usepackage{accsupp}
\newcommand\nosee[1]{%
  \BeginAccSupp{method=escape,ActualText={\detokenize{#1}}}%
[\phantom{#1}]%
\EndAccSupp{}%
}
\begin{document}
Now you see me\nosee{, now you don't}.
\end{document}

PDF 视觉输出是

如果我按 Ctl-A、Ctl-C 复制整个文档内容并粘贴，则生成的文本是

Now you see me, now you don't .

后面这段文本是可搜索的。我现在分配了与不可见文本相等的括号空间。如果你在括号之间突出显示，文本是可标记的，但只有在全也就是说，要么突出显示整个隐藏文本，要么不突出显示任何文本。目前的方法不允许突出显示隐藏文本的一部分。

补充

在这里，我使用分别tokcycle处理\invisible输入流的每个标记\nosee，从而允许部分/连续文本突出显示。这里的缺点是环境适用于纯文本，任何宏都只会被分解为剪切/粘贴输出。

这种方法还有提供换行的额外优势。

不再需要对输出进行括号分隔...我改为\textunderscore对遇到的每个字符或空格输出白色。

\documentclass{article}
\usepackage[T1]{fontenc}
\usepackage{accsupp,xcolor,lmodern,tokcycle}
\newcommand\nosee[1]{%
  \sbox0{\detokenize{#1}}%
  \BeginAccSupp{method=escape,ActualText={\detokenize{#1}}}%
\makebox[\wd0]{\textcolor{white}{\textunderscore}}\allowbreak%
\EndAccSupp{}%
}
\tokcycleenvironment\invisible
{\addcytoks{\nosee{##1}}}
{\processtoks{##1}}
{\addcytoks{\nosee{##1}}}
{\addcytoks{\nosee{ }}}
\begin{document}
Now you see me\invisible , now you don't\endinvisible.
\end{document}

Question 2

非常感谢 Nelson 在他的回答！

正如 Nelson 所解释的那样，Evince 使用 Poppler 库来显示 pdf 文件。改变在 Poppler 中，他提到的任何文本选择text rendering mode 3都会透明显示，该功能包含在 20.09.0 版本中。以前，任何选择都不会透明呈现，即使在 tesseract 创建的文件中也是如此。

对于我的问题中的示例，我使用了带有 Poppler 0.80.0 的 Ubuntu 19.10，目前我使用的是带有 Poppler 0.86.1 的 Ubuntu 20.04。在这两个版本中，使用 tesseract 创建的 pdf 文件中的选择都是透明显示的，但在我使用的问题示例中却不是这样text rendering mode 3。

在较旧的 Poppler 版本（在 Ubuntu 系统上）中，它已经（部分）正确显示的原因是由于早期的修补对于 Ubuntu，修复了 tesseract 中专用的 GlyphLessFont 的选择显示。这仅修复了 tesseract 生成的文件的显示，而其他文件text rendering mode 3仍然显示为不透明。

自 Ubuntu 版本 20.10 起，使用修复的 Poppler 版本 20.09.0，以便每个 pdf 文件中的文本选择都text rendering mode 3透明显示。

附加信息：

一个回答相关问题解释了不同的 OCR 程序如何将其 OCR 信息存储在 pdf 文件中。

Answer