是否可以从出现“无效 XRef 条目”错误的 PDF 中提取文本?

是否可以从出现“无效 XRef 条目”错误的 PDF 中提取文本?

我有一个 PDF 文件,我想阅读,但无法在 Adob​​e Reader 中打开。使用 pdftotext 时,我看到它显示“无效的 XRef 条目”。PDFtk 和 Ghostscript 无法解析该文件。我尝试手动修复它,但很快意识到这超出了我的能力范围。

我想知道是否有办法从文件中恢复文本?我可以看到很多图像资源,但没有任何文本清晰可见。有人知道是否可以恢复吗?

答案1

手动修改 PDF 内容注定会失败(除非你真的知道自己在做什么,以及知道如何去做)。

如果当前版本的 Acrobat(Reader)无法修复该问题,您可以尝试使用 Acrobat/Reader 7 或更早的版本;旧版本的 Acrobat/Reader 比新版本尝试修复混乱的文档的次数更多。

否则…修复它的机会就很小了。

相关内容