从恶意 PDF 中提取元数据的代码/工具

Question

检查损坏的 PDF 文件的最简单方法就是在可以处理大文件的编辑器中打开它们（我使用 emacs）。首先尝试使用良好的 PDF 文件。您将看到 PDF 文件的对象结构，但部分或全部内容流将被压缩。您还可以通过这种方式看到“恶意”PDF 正在做什么来迷惑您的解析器，并且您应该能够相应地更正解析器。（如果不知道“恶意”PDF 的作用，我们显然无法为您做到这一点）。

您还可以使用mutool clean -d解压缩流，但mutool可能会或可能不会对损坏的 PDF 的作用感到困惑。再次强调，首先在有效的 PDF 上尝试此操作。

Answer 1

检查损坏的 PDF 文件的最简单方法就是在可以处理大文件的编辑器中打开它们（我使用 emacs）。首先尝试使用良好的 PDF 文件。您将看到 PDF 文件的对象结构，但部分或全部内容流将被压缩。您还可以通过这种方式看到“恶意”PDF 正在做什么来迷惑您的解析器，并且您应该能够相应地更正解析器。（如果不知道“恶意”PDF 的作用，我们显然无法为您做到这一点）。

您还可以使用mutool clean -d解压缩流，但mutool可能会或可能不会对损坏的 PDF 的作用感到困惑。再次强调，首先在有效的 PDF 上尝试此操作。

从恶意 PDF 中提取元数据的代码/工具

答案1

相关内容