如何比较两个 PDF 文件的内容?

如何比较两个 PDF 文件的内容?

可能重复:
如何比较两个PDF文件之间的差异?

我目前正在总结一份明年需要再次参加的课程的 PDF,
PDF 的内容可能会发生变化,从而导致我的总结出现错误。

有没有办法可以查看 PDF 文件两个版本之间的变化?

答案1

我之前一直使用 xpdf 工具箱的 pdftotext 将内容导出为纯文本,并将其与我最喜欢的 diff 工具进行比较。现在我发现pdfdiff,一个 Python 脚本,它的功能与我之前手动完成的功能完全相同。快速测试表明,它能够完成应有的功能。

感谢您的提问,这让我寻找一个新的、有用的工具。

编辑

我建议使用它融合,一个很棒的差异工具,由 pdfdiff 支持。

答案2

答案3

我的第一个答案是检查文件大小,或者如果您想要更精确的信息,只需进行 MD5 校验和验证(在 Mac 上,它是 /sbin/md5 vi 命令行)。例如,如果您有文件 a.pdf 和 a.newer.pdf,您可以执行以下操作:

md5 -q a.pdf && md5 -q a.newer.pdf

应该返回类似

e097902c53d9066aaf679037b6432bdb
920621db3765f6d580a498035b587f67

即使是一个很小的变化也会导致巨大的哈希差异。

相关内容