标记的 PDF:从 pdftex 访问/Pages 对象?

标记的 PDF:从 pdftex 访问/Pages 对象?

我正在标记用 pdflatex 生成的 PDF,并且我认为我需要添加对/Pages目录中对象的引用。(具体来说,在下面/ParentTree/StructTreeRoot虽然标准文档对于这里真正属于什么非常神秘。)但 pdftex 手册似乎没有透露任何执行此操作的机制。有吗?

或者,如果有更好的方法用 pdflatex 标记 PDF(“切换到 ConTeXt”不符合条件),我很乐意避免重新发明轮子。

答案1

/ParentTree 与 /Pages 字典没有直接关系。它是一个引用数组,每个引用对应一个“虚拟页面”;这些引用包括所有注释、图像和图像掩码、XObject 以及实际页面。

实际页面的引用是每个标记内容的结构父级数组,按其 MCID 整数进行索引。除非您要生成完全标记的 PDF,否则这些都没有任何用处。我目前正在为此编写一个 LaTeX 包,使用 pdfTeX 作为引擎。

如果您需要更具体的帮助或者示例,请与我联系。

相关内容