假设我有一个 PDF,并且我想获取该 PDF 可用的任何元数据。我应该使用什么实用程序?
我发现我通常最感兴趣的信息是纸张尺寸,PDF 查看者通常不会报告的内容。例如,PDF 尺寸是 letter、legal、A4 还是其他尺寸?但其他可用信息也可能令人感兴趣。
答案1
如果我记得的话,这方面的规范工具之一是pdfinfo
,它与 xpdf 一起提供。输出示例:
[0 1017 17:10:17] ~/temp % pdfinfo test.pdf
Creator: TeX
Producer: pdfTeX-1.40.14
CreationDate: Sun May 18 09:53:06 2014
ModDate: Sun May 18 09:53:06 2014
Tagged: no
Form: none
Pages: 1
Encrypted: no
Page size: 595.276 x 841.89 pts (A4)
Page rot: 0
File size: 19700 bytes
Optimized: no
PDF version: 1.5
答案2
另一个值得研究的实用程序是出口工具。对于您的具体情况,它可能不是合适的工具,因为它不报告有关文档几何形状的任何信息,但总的来说,它可能是用于检查 PDF 元数据的功能最齐全的工具。
下面是一个命令示例,它将打印所有可用的元信息 ( -a
),并按组 ( -G1
) 排序:
exiftool -a -G1 "$File"
官方文档提供了支持的 PDF 相关标签的概述:
您可以使用以下命令在 Debian/Ubuntu 上安装 exiftool:
sudo apt-get install libimage-exiftool-perl
如果你更喜欢 GUI 方面的东西,你可以给我的项目PDF教育尝试一下。它是一组工具,用作 exiftool 的图形前端,并允许查看和编辑 PDF 元数据。
以下是一些屏幕截图: