发现有关 PDF 的元数据

发现有关 PDF 的元数据

假设我有一个 PDF,并且我想获取该 PDF 可用的任何元数据。我应该使用什么实用程序?

我发现我通常最感兴趣的信息是纸张尺寸,PDF 查看者通常不会报告的内容。例如,PDF 尺寸是 letter、legal、A4 还是其他尺寸?但其他可用信息也可能令人感兴趣。

答案1

如果我记得的话,这方面的规范工具之一是pdfinfo,它与 xpdf 一起提供。输出示例:

[0 1017 17:10:17] ~/temp % pdfinfo test.pdf
Creator:        TeX
Producer:       pdfTeX-1.40.14
CreationDate:   Sun May 18 09:53:06 2014
ModDate:        Sun May 18 09:53:06 2014
Tagged:         no
Form:           none
Pages:          1
Encrypted:      no
Page size:      595.276 x 841.89 pts (A4)
Page rot:       0
File size:      19700 bytes
Optimized:      no
PDF version:    1.5

答案2

另一个值得研究的实用程序是出口工具。对于您的具体情况,它可能不是合适的工具,因为它不报告有关文档几何形状的任何信息,但总的来说,它可能是用于检查 PDF 元数据的功能最齐全的工具。

下面是一个命令示例,它将打印所有可用的元信息 ( -a),并按组 ( -G1) 排序:

exiftool -a -G1 "$File"

官方文档提供了支持的 PDF 相关标签的概述:

您可以使用以下命令在 Debian/Ubuntu 上安装 exiftool:

sudo apt-get install libimage-exiftool-perl

如果你更喜欢 GUI 方面的东西,你可以给我的项目PDF教育尝试一下。它是一组工具,用作 exiftool 的图形前端,并允许查看和编辑 PDF 元数据。

以下是一些屏幕截图:

在此输入图像描述

在此输入图像描述

相关内容