如何向 pdf 文件添加更多元数据,以便我获得更多信息

如何向 pdf 文件添加更多元数据,以便我获得更多信息

我很幸运,很多时候,如果我遇到一些有趣的内容、辩论等,其中涉及一些 pdf,我通常会让作者将内容/pdf 邮寄给我,或者通过 IM 或其他方式向我发送相同的内容。一段时间后,我忘记了上下文或是谁将内容发送给我的。虽然我不知道限制,但我很确定至少可以添加几个字段。例如,这里是我当前正在查看的 pdf 文件的元数据。

File Size                       : 3.6 MB
File Modification Date/Time     : 2019:11:24 01:11:52+05:30
File Access Date/Time           : 2019:11:24 01:12:00+05:30
File Inode Change Date/Time     : 2019:11:24 01:11:54+05:30
File Permissions                : rw-r--r--
File Type                       : PDF
File Type Extension             : pdf
MIME Type                       : application/pdf
PDF Version                     : 1.4
Linearized                      : No
Page Count                      : 54
Producer                        : Mac OS X 10.11.6 Quartz PDFContext
Creator                         : LaTeX with hyperref package
Create Date                     : 2018:05:01 19:56:31Z
Modify Date                     : 2018:05:01 19:56:31Z

现在我问一种可以添加超链接等字段的方法(这样我就可以记住从哪里下载特定文件),或者这样我总是可以知道/参考或找出谁共享了内容/pdf 文件与我一起。我确实看到了 pdftk 的联机帮助页,或者更确切地说是 Debian 中的 pdftk-java 的联机帮助页。有一个叫做但共享的示例并不能让我轻松理解应该如何使用它。有人可以帮忙吗?from : [email protected]update_info

答案1

首先,您必须导出相关文件的元数据。命令

pdftk file.pdf dump_data output metadata

将生成metadata一个包含 的所有元数据的文件file.pdf。在此文件中,您将找到以下形式的结构:

...
InfoBegin
InfoKey: Creator
InfoValue: pdftk 3.0.2 - www.pdftk.com
...

您可以通过添加以下行来创建自己的元数据密钥

InfoBegin
InfoKey: Hyperlink
InfoValue: [email protected]

到文件。最后,您需要更新file.pdfwith的元数据

pdftk file.pdf update_info metadata output file2.pdf

请注意,后者会生成一个新文件file2.pdf。现在,您有两个文件:file1.pdf没有添加的元数据和file2.pdf带有自定义元数据密钥。您可以使用exiftool返回的命令检查一切是否顺利

...
Hyperlink                       : [email protected]
Modify Date                     : 2019:10:08 18:42:36+02:00
Creator                         : pdftk 3.0.2 - www.pdftk.com
Create Date                     : 2019:10:08 18:42:36+02:00
...

答案2

您可以使用 pdftk 将文档页面复制到新的 PDF 中,从而从文档中删除所有 Info 和 XMP 元数据,如下所示:

pdftk A=mydoc.pdf cat A 输出 mydoc.no_metadata.pdf

相关内容