PDF 中的每一页都可以包含自己的元数据吗?

PDF 中的每一页都可以包含自己的元数据吗?

PDF 中的每一页是否可以具有相同的字段名称,但具有不同的元数据值?

例如,假设每个页面都有字段“作者”、“文档参考”、“位置”等...并且这些字段在每个页面上都有不同的值。因此,本例中第 1 页的作者是“John Smith”,第 2 页的作者是“Jane Simmons”,依此类推。

我所见过的 PDF 元数据的唯一示例均与文档范围的信息有关 - 但没有一个与仅限页面的信息有关。

我正在使用 Python 进行开发。

谢谢。 :)

答案1

看起来该标准不仅仅在文档级别支持元数据:

一般而言,任何 PDF 流或字典都可以附加元数据,只要该流或字典代表实际的信息资源,而不是作为实现工件即可。某些 PDF 构造被视为实现性的,因此可能没有关联的元数据。

一清二楚!幸亏还有一些补充说明。包括:

此外,元数据还可以与内容流中的标记内容相关联。此关联应通过在属性列表字典中包含一个条目来创建,该条目的键应为元数据,其值应为元数据流字典。由于此构造引用内容流之外的对象,因此属性列表被间接地称为命名资源(参见 14.6.2,“属性列表”)。

这意味着您可以将元数据附加到文档中的某些工件,但我不认为您可以将它们附加到特定页面,您必须有一个附加数据的对象 - 图像就是明显的例子,尽管标准似乎也指阴影。

当然,虽然标准似乎允许这样做,但这并不意味着常见的 PDF 处理库和应用程序支持它。

Adobe 的可下载标准版本(可节省 200 瑞士法郎)

答案2

PDF 页面可以有注释;最常见的类型可能是类似便签的注释,但这些并不是唯一的注释。Adobe PDF 1.7 参考的第 8.4 部分描述了这些注释。您可以创建文本注释,使用“author”等键命名它们,并将内容设置为相应的字符串值。然后将隐藏标志设置为 true,这样注释就不会显示或不允许与用户交互。需要为注释设置一个矩形,但由于它不会显示,所以页面内的任何矩形都可以。

相关内容