我有一个包含多个 PDF 文件的目录。每个文件都包含相同的图像(分辨率非常高,需要保持这种状态),但文本不同:
my-doc-en.pdf
my-doc-es.pdf
my-doc-de.pdf
我尝试过像这样连接文件:
pdftk my-doc-en.pdf my-doc-es.pdf my-doc-de.pdf cat output my-doc-multi.pdf
输出文件的大小似乎与输入文件大小的总和大致相同。这在其他 情况。
但是,就我的具体情况而言,我需要一种方法来生成一个输出文件,该文件(以某种方式)知道每个 PDF 都包含在其他 PDF 中找到的图像,并且不会重复它们。
现有工具是否已内置此功能?
上下文:我有*.tex
生成这些 PDF 的文件,因此我可以在 PDF 生成步骤中找到通过该路径实现此目的的方法。但是,如果这适用于已输出的 PDF 文件,那将是一个更简洁的选择。