我所在的组织有一个采购部门,负责处理大量采购订单。当他们将采购订单作业“打印”为 PDF 时,生成的 PDF 可能包含一个或多个采购订单的页面。
例如,pdf 可能总共有 6 页,但第 1-2 页用于一份采购订单,第 3-4 页用于一份采购订单,第 5-10 页用于第三份采购订单。每份采购订单的第一页上都有“采购订单”字样。
他们现在想要拆分之前生成的 PDF,以便每个 PDF 都用于单独的采购订单。有没有办法使用 pdftk 或类似工具根据关键字“采购订单”拆分 PDF?拆分后的每个 PDF 应该只包含每个采购订单的页面。每个采购订单的页数因采购订单而异,所以我不能使用标准值,例如每 2 页拆分一次,这就是为什么需要使用“采购订单”字样作为分隔符来知道在哪里拆分原始 PDF。
如果有人有任何提示或示例脚本(bash)可以帮助解决这个问题,我将非常感激。
谢谢,克里斯