我需要一个 shell 脚本来检测有效的 PDF。也就是说,我只需要保留纯 ASCII PDF。其他包含非 ASCII 内容和恶意脚本的 PDF 需要删除。我该怎么做呢?有没有可用的脚本来做到这一点?
答案1
您想要的是所谓的病毒扫描程序。例如。蛤蜊病毒
答案2
这里有一些 python 脚本。 “恶意软件档案:PDF 文件”Bruce Schneier 在他的网站上也提到了这一点。
pdf2ps 很简单,但不太确定。这是有趣的 PDF/Ahttp://en.wikipedia.org/wiki/PDF/A不允许多媒体元素。