如何保留从 LaTeX PDF 复制的 Python 代码中的缩进？

Question 1

还有一个解决方案在 Acrobat Reader 和 Chrome 中都可以很好地运行，但仅与 pdfTeX 兼容（不与 XeTeX/LuaTeX 兼容）：

\usepackage{transparent}
\makeatletter
\def\@xobeysp{\leavevmode\nobreak\texttransparent{0}{\char32}}
\makeatother

用于\texttransparent使 ⎵ 符号不可见（实际上，在某些字体中，插槽 32 被映射到真实空格字符上，并且这个技巧不是必需的，但上述代码涵盖了所有情况）。

最有可能的是，此代码之所以有效，是因为生成的文件不是基于 Unicode 的，并且 PDF 查看器没有关于代码 32 与实际 Unicode 字符之间匹配的信息，因此它将其“按原样”复制为字符代码 32（即空格字符）。支持这一假设的是，有失败的 XeTeX/LuaTeX 生成的文件和通过/ActualText命令设置 Unicode 对应的尝试（通过替换\char32上述\pdfliteral direct{/Span<</ActualText<FEFF0020>>> BDC}\char32\pdfliteral direct{EMC}代码中的）。

Answer

还有一个解决方案在 Acrobat Reader 和 Chrome 中都可以很好地运行，但仅与 pdfTeX 兼容（不与 XeTeX/LuaTeX 兼容）：

\usepackage{transparent}
\makeatletter
\def\@xobeysp{\leavevmode\nobreak\texttransparent{0}{\char32}}
\makeatother

用于\texttransparent使 ⎵ 符号不可见（实际上，在某些字体中，插槽 32 被映射到真实空格字符上，并且这个技巧不是必需的，但上述代码涵盖了所有情况）。

最有可能的是，此代码之所以有效，是因为生成的文件不是基于 Unicode 的，并且 PDF 查看器没有关于代码 32 与实际 Unicode 字符之间匹配的信息，因此它将其“按原样”复制为字符代码 32（即空格字符）。支持这一假设的是，有失败的 XeTeX/LuaTeX 生成的文件和通过/ActualText命令设置 Unicode 对应的尝试（通过替换\char32上述\pdfliteral direct{/Span<</ActualText<FEFF0020>>> BDC}\char32\pdfliteral direct{EMC}代码中的）。

Question 2

pdfTeX 有命令\pdffakespace在文档中插入空格。这个空格是不可见的，但在文本复制过程中会被考虑在内。

因此，我的第一个想法是在每个行首的空格后插入\pdffakespace，但不幸的是，它导致复制的文本中的空格加倍（一个空格来自\pdffakespace，另一个空格由 Acrobat Reader 自动从 TeX 生成\hskip）。

下一个想法是计算行首空格的数量，并\pdffakespace在这些空格后插入所需数量的空格。不幸的是，Acrobat Reader 将这些空格修剪为一个空格（尽管空格命令序列[( )]TJ实际上显示在生成的 PDF 文件中）。

但最终，我找到了一个棘手的解决方案：将空格分组，并用双倍空格宽度的序列替换它们\pdffakespace。\hskip从标准序言开始，制作@一封信

\makeatletter

我们通过在命令定义末尾\@verbatim添加来重新定义命令（以处理换行后的文本）：\hook@par\par

\def\@verbatim{\trivlist \item\relax
  \if@minipage\else\vskip\parskip\fi
  \leftskip\@totalleftmargin\rightskip\z@skip
  \parindent\z@\parfillskip\@flushglue\parskip\z@skip
  \@@par
  \language\l@nohyphenation
  \@tempswafalse
  \def\par{%
    \if@tempswa
      \leavevmode \null \@@par\penalty\interlinepenalty
    \else
      \@tempswatrue
      \ifhmode\@@par\penalty\interlinepenalty\fi
    \fi\hook@par}% <=== HERE
  \let\do\@makeother \dospecials
  \obeylines \verbatim@font \@noligs
  \everypar \expandafter{\the\everypar \unpenalty}%
}

然后我们创建一个计数器来计算行首的空格数

\newcount\nspaces

在行首重置此计数器，并计算空格的序列

\def\hook@par{\nspaces=0\relax\check@space}
\def\check@space{\futurelet\@let@token\do@check@space}
\def\do@check@space{%
  \ifx\@let@token\@xobeysp%
    \advance\nspaces 1%
    \expandafter\skip@space%
  \else%
    \ifnum\nspaces>0%
      \print@spaces%
    \fi%
  \fi}
\def\skip@space#1{\check@space}

最后，我们打印成对的空格（对奇数个空格有特殊处理，在这种情况下，我们最终会\pdffakespace在单个空格之后输出一个空格\hskip，该空格将与前一个空格合并\hskip，并在文本复制期间产生单个空格）

\def\print@spaces{%
  \leavevmode\nobreak
  \loop%
    \pdffakespace%
    \nobreak\hskip\dimexpr 2\fontdimen2\font\relax%
    \advance\nspaces by -2\relax%
  \unless\ifnum\nspaces<2\repeat%
  \ifnum\nspaces>0%
    \nobreak\hskip\fontdimen2\font\relax%
    \pdffakespace%
  \fi}

最后别忘了恢复@回来：

\makeatother

就这样。瞧。

Answer