从 PDF 中删除页面范围元数据

2024-7-12 • tag-icon

我合并了多个使用 Latex 生成的 PDF。这些 PDF 包含页面范围，这意味着“实际页面”40 和“实际页面 41”是简单的过渡 - 例如将项目添加到项目符号列表。因此，当我在 PDF 查看器中转到第 41 页时，我最终到达了“实际页面”42。

由于多个文件已合并，这些页面范围在我的 PDF 查看器中发生冲突，请参见此处（第 1 页指向“真实页面”260、309、338 等）：

我尝试过本指南和这个 github gist删除 PDF 元数据。

qpdf --linearize pages.pdf
# or
exiftool -all:all= pages.pdf

两种方法都不起作用。除了打印为 PDF 之外，还有其他方法可以删除此页面元数据吗？

看一眼pagelabels-py。它似乎是一个可以编辑 PDF 页面标签的 Python 脚本。它给出了以下内容示例命令：
python3 -m pagelabels --delete file.pdf

相关内容