我合并了多个使用 Latex 生成的 PDF。这些 PDF 包含页面范围,这意味着“实际页面”40 和“实际页面 41”是简单的过渡 - 例如将项目添加到项目符号列表。因此,当我在 PDF 查看器中转到第 41 页时,我最终到达了“实际页面”42。
由于多个文件已合并,这些页面范围在我的 PDF 查看器中发生冲突,请参见此处(第 1 页指向“真实页面”260、309、338 等):
我尝试过本指南和这个 github gist删除 PDF 元数据。
qpdf --linearize pages.pdf
# or
exiftool -all:all= pages.pdf
两种方法都不起作用。除了打印为 PDF 之外,还有其他方法可以删除此页面元数据吗?
答案1
看一眼pagelabels-py。它似乎是一个可以编辑 PDF 页面标签的 Python 脚本。它给出了以下内容示例命令:
python3 -m pagelabels --delete file.pdf