PDF结构图形表示:显示最终pdf文件中各部分所占比例

PDF结构图形表示:显示最终pdf文件中各部分所占比例

当我写一篇有固定页数限制的论文时,我经常想看看哪个部分占用了太多空间,以便我可以将其移到附录中。为此,我希望我的 pdf 有一个图形表示。我想要的最基本的东西是一个表示每个部分(包括参考文献)比例的图表,并清楚地说明页数限制在哪里以及主要论文和附录之间的当前过渡在哪里。如果可能的话,我希望比页码更精确,以避免认为一个部分只占用一页,因为它从一页的末尾开始。

我希望将这些信息直接显示在我的 PDF 的每一页上,例如在每一页的页脚中使用覆盖图,但我也可以接受使用外部工具来实现可视化。

奖金:另一个有助于可视化我的 pdf 的好工具是列出初稿部分中从未在主要论文中使用过的定义和定理(有时,当我将证明移到附录中时,我不需要在介绍中介绍这个概念)。从图形上讲,它可以通过标签列表来表示,也可以通过交互式网页来表示,该网页显示每个锚点以及指向它的每个部分的箭头……

编辑

我找到了一种使用以下方法访问页面数据中的页面/位置的方法:

$ mutool show {your-pdf-file} outline
+       "Introduction"  #2,135,116
|               "Our Results"   #2,135,533
[...]

最后的格式是#PAGE,X,YXY距离左上角的距离,以 UserUnit 为单位,默认情况下等于 1/72 英寸 = 2.54/72 厘米。我猜可以使用解析器来获得类似的结果,我知道 LuaLaTeX 内部有一个 pdf 解析器,参见pdfe262(目前)LuaLaTeX 手册。不确定是否可以直接检查aux文件或类似内容以获取这些信息:目前我可以找到页面 grepping newlabels,但找不到 X/Y 位置。此外,我们需要找到文本主体的开始/结束,以使这些数字更有用。

相关内容