较大的 LaTeX 分隔符在 pdf 中的编码很奇怪。我该如何避免这种情况?

较大的 LaTeX 分隔符在 pdf 中的编码很奇怪。我该如何避免这种情况?

我最近注意到,更改 LaTeX 中括号的大小会导致 pdf 中的文本编码不同(使用 pdf 查看器中的复制/粘贴功能确定)。例如,在命令中

$\sin(x) + \sin\bigl(x\bigr)$

第一项编码为 ,s i n ( x )而第二项编码为 s i n <CR> <LF> <U+FFFD> <CR> <LF> x <CR> <LF> <U+FFFD>。(这里<CR>回车<LF>换行, 和<U+FFFD>未知、无法识别或无法表示的特征)。

这种行为是不可取的,因为它使得无法通过搜索文件找到“sin(x)”的所有实例。作为一名专门在计算机上阅读论文和书籍的数学家,我发现 pdf 文档易于搜索非常重要。从可访问性的角度来看,这也至关重要。

问题:有没有什么简单的方法可以改进 pdf 文件的编码,以便(例如)上面的两个术语以相同的方式编码?

此网站有相关问题这是使用该accsupp包解决的,但在我的例子中,该方法会生成文本字符串\sin (x) + \sin \big (x\big ),这也不太理想,而且在 LaTeX 文件中使用起来很麻烦。[随机问题:一些视障用户是否更喜欢记录分隔符的大小,正如此输出所暗示的那样?]

答案1

如何复制和粘贴字形取决于字体的 ToUnicode 值。使用旧的 type1 字体设置它们并不是一件容易的事。改善复制粘贴和数学可访问性的最简单方法是使用 lualatex 和 unicode-math 包,因此使用开放式数学字体:

\documentclass{article}
\usepackage{unicode-math}

\begin{document}

$\sin(x) + \sin\bigl(x\bigr)$

\end{document}

然后将公式复制为

罪(

相关内容