我发现了一个损坏的 PDF 文件,当我尝试在 Adobe Acrobat Reader 中打开该文件时出现以下消息:
There was an error opening this document. The file is damaged and could not be repaired.
如何使用命令行查找其他损坏的 PDF 文件?
我尝试过的一个有效方法是使用 Ghostscript 将文件转换为 Postscript ps2pdf
。当 Ghostscript 尝试转换损坏的文件时,它会正确地抛出错误。
问题是这些 PDF 数量很多,而且文件大小需要很长时间才能检查ps2pdf
。
我也尝试了 Linuxfile
命令。它正确地将文件类型返回为 PDF,但没有提及文件是否已损坏。
是否有可靠有效的方法来检查 PDF 文件是否损坏?
编辑
以下是有关我正在使用的 Ubuntu 发行版的数据:
DISTRIB_ID=Ubuntu
DISTRIB_RELEASE=18.04
DISTRIB_CODENAME=bionic
DISTRIB_DESCRIPTION="Ubuntu 18.04.2 LTS"
它是在 AWS 上发现的 Ubuntu 服务器。