如何标准化(规范化)页面大小存在大量微小变化的 PDF 中的页面大小?

如何标准化(规范化)页面大小存在大量微小变化的 PDF 中的页面大小?

我的项目是将每周的时事通讯处理成年度 PDF 汇编。

硬拷贝原件由其他人使用 Abbyy FineReader 扫描。原始文档为美国信纸尺寸(612 x 792 点),但许多/大部分页面稍大或稍小,例如 588 x 795。

边缘有足够的空白,可以根据需要进行裁剪;同样,如果我必须增加页面大小,我可以添加页边距。但我希望每个页面的尺寸恰好为 612 x 792。(每英寸为 72 点,即 8.5 x 11 英寸。)

我没有 Adob​​e Acrobat,因此我使用开源工具。主要是我一直在研究sejda-console和ghostscript,特别是使用ghostscript来应用pdfmarks。 Ghostscript 的错误消息并不总是有帮助。我的一份文档无法编译过去的 p.1。 12,虽然我在第12页上找不到任何问题。 13.

我也尝试过直接编辑PDF文件。我不太确定文件结构,其中包括许多与纯文本混合的二进制内容。我认为关键项目是 MediaBox 和可能的 CropBox 大小,我尝试使用编辑器手动更改它们。大多数情况下,这很有效,尽管页面默认锚定在左下角,这意味着如果我更改宽度和高度,例如,它将分别更改右侧和顶部边距的大小。大多数情况下,这并不会令人反感,但偶尔当发生重大变化时,最好将添加或删除的边距按比例从左到右和/或从上到下分配。

我将其发布在 Unix & Linux 论坛中,该论坛似乎拥有大部分关于 PDF 操作的 Stack Exchange 流量,尽管我一直在使用我的 Windows 机器来完成这个项目。如果需要的话,我也有一个 Linux 盒子。

感谢您为我指明正确方向的任何帮助。

相关内容