如何比较多个 PDF 文件?

如何比较多个 PDF 文件?

我的教授刚刚上传了整个学期的所有幻灯片的更新版本(17 个 PDF),并将它们称为现在确定的考试材料。

问题是,我在旧幻灯片上做了很多笔记,我不想失去我所做的所有工作。由于我的教授随机删除或向新幻灯片中添加了一些幻灯片,所以我更希望以某种方式自动完成比较新旧幻灯片的任务。有什么想法吗?

答案1

由于您没有提到系统或工具,以下是我比较文本的解决方案,假设不是扫描图像。它应该适用于任何 Unix、Cygwin,我猜也适用于 Msys。

$ pdftotext.exe old-slide.pdf
$ pdftotext.exe new-slide.pdf
$ diff -uN old-slide.txt new-slide.txt| tee -a slides.diff

pdftotext是的一部分popplerdiffdiffutils

当然,如果 PDF 文件具有序列名称和类似的名称,则可以对所有文件进行循环自动化。

相关内容