用于检测包含非 ASCII 内容的 PDF 的 Shell 脚本

用于检测包含非 ASCII 内容的 PDF 的 Shell 脚本

我需要一个 shell 脚本来检测有效的 PDF。也就是说,我只需要保留纯 ASCII PDF。其他包含非 ASCII 内容和恶意脚本的 PDF 需要删除。我该怎么做呢?有没有可用的脚本来做到这一点?

答案1

您想要的是所谓的病毒扫描程序。例如。蛤蜊病毒

答案2

这里有一些 python 脚本。 “恶意软件档案:PDF 文件”Bruce Schneier 在他的网站上也提到了这一点。

pdf2ps 很简单,但不太确定。这是有趣的 PDF/Ahttp://en.wikipedia.org/wiki/PDF/A不允许多媒体元素。

相关内容