如何比较 .pdf 文件的内容（不包括文件名）？

Question 1

如果你有某种可用的 unix 环境（如果你在 Windows 上，我建议赛格威）你可以很容易地找到当前目录下的重复文件，如下所示：

find . -type f -exec md5sum '{}' '+' | sort | uniq -D -w 32

输出将是 md5sum 和每个至少有一个重复项（相同的 md5sum）的文件的名称。重复项按字母顺序依次显示。如果不是当前目录，请将.后面的内容替换为您要查找的路径。find

相反，要获取没有重复的文件，您可以使用

find . -type f -exec md5sum '{}' '+' | sort | uniq -u -w 32

这将仅打印当前目录下没有任何重复的文件。

Answer

如果你有某种可用的 unix 环境（如果你在 Windows 上，我建议赛格威）你可以很容易地找到当前目录下的重复文件，如下所示：

find . -type f -exec md5sum '{}' '+' | sort | uniq -D -w 32

输出将是 md5sum 和每个至少有一个重复项（相同的 md5sum）的文件的名称。重复项按字母顺序依次显示。如果不是当前目录，请将.后面的内容替换为您要查找的路径。find

相反，要获取没有重复的文件，您可以使用

find . -type f -exec md5sum '{}' '+' | sort | uniq -u -w 32

这将仅打印当前目录下没有任何重复的文件。

Question 2

我觉得i-net PDF内容比较器将会很有帮助。

现为 2.0 版，提供 GUI 和灵活的定价选项。仍有 30 天免费试用版，您可以借此检查软件的各个方面。

比较结果

Answer

我觉得i-net PDF内容比较器将会很有帮助。

现为 2.0 版，提供 GUI 和灵活的定价选项。仍有 30 天免费试用版，您可以借此检查软件的各个方面。

比较结果

Question 3

作为替代解决方案你可以想想关于以相同的名称存储每个 PDF 的纯文本副本（从 with、fe、pandoc 转换而来）并仅使用任何工具比较文本版本

Answer

作为替代解决方案你可以想想关于以相同的名称存储每个 PDF 的纯文本副本（从 with、fe、pandoc 转换而来）并仅使用任何工具比较文本版本

Question 4

尝试使用“PDF Compare”应用程序，它可以在像素级别比较 pdf 文档元数据和页面图像：

Answer

尝试使用“PDF Compare”应用程序，它可以在像素级别比较 pdf 文档元数据和页面图像：

相关内容