我最近注意到,更改 LaTeX 中括号的大小会导致 pdf 中的文本编码不同(使用 pdf 查看器中的复制/粘贴功能确定)。例如,在命令中
$\sin(x) + \sin\bigl(x\bigr)$
第一项编码为 ,s i n ( x )
而第二项编码为
s i n <CR> <LF> <U+FFFD> <CR> <LF> x <CR> <LF> <U+FFFD>
。(这里<CR>
是回车,<LF>
是换行, 和<U+FFFD>
是未知、无法识别或无法表示的特征)。
这种行为是不可取的,因为它使得无法通过搜索文件找到“sin(x)”的所有实例。作为一名专门在计算机上阅读论文和书籍的数学家,我发现 pdf 文档易于搜索非常重要。从可访问性的角度来看,这也至关重要。
问题:有没有什么简单的方法可以改进 pdf 文件的编码,以便(例如)上面的两个术语以相同的方式编码?
此网站有相关问题这是使用该accsupp
包解决的,但在我的例子中,该方法会生成文本字符串\sin (x) + \sin \big (x\big )
,这也不太理想,而且在 LaTeX 文件中使用起来很麻烦。[随机问题:一些视障用户是否更喜欢记录分隔符的大小,正如此输出所暗示的那样?]
答案1
如何复制和粘贴字形取决于字体的 ToUnicode 值。使用旧的 type1 字体设置它们并不是一件容易的事。改善复制粘贴和数学可访问性的最简单方法是使用 lualatex 和 unicode-math 包,因此使用开放式数学字体:
\documentclass{article}
\usepackage{unicode-math}
\begin{document}
$\sin(x) + \sin\bigl(x\bigr)$
\end{document}
然后将公式复制为
罪(