根据关键字将 pdf 拆分为单独的文件

2024-12-5 • tag-icon

我所在的组织有一个采购部门，负责处理大量采购订单。当他们将采购订单作业“打印”为 PDF 时，生成的 PDF 可能包含一个或多个采购订单的页面。

例如，pdf 可能总共有 6 页，但第 1-2 页用于一份采购订单，第 3-4 页用于一份采购订单，第 5-10 页用于第三份采购订单。每份采购订单的第一页上都有“采购订单”字样。

他们现在想要拆分之前生成的 PDF，以便每个 PDF 都用于单独的采购订单。有没有办法使用 pdftk 或类似工具根据关键字“采购订单”拆分 PDF？拆分后的每个 PDF 应该只包含每个采购订单的页面。每个采购订单的页数因采购订单而异，所以我不能使用标准值，例如每 2 页拆分一次，这就是为什么需要使用“采购订单”字样作为分隔符来知道在哪里拆分原始 PDF。

如果有人有任何提示或示例脚本（bash）可以帮助解决这个问题，我将非常感激。

谢谢，克里斯

相关内容