我很幸运,很多时候,如果我遇到一些有趣的内容、辩论等,其中涉及一些 pdf,我通常会让作者将内容/pdf 邮寄给我,或者通过 IM 或其他方式向我发送相同的内容。一段时间后,我忘记了上下文或是谁将内容发送给我的。虽然我不知道限制,但我很确定至少可以添加几个字段。例如,这里是我当前正在查看的 pdf 文件的元数据。
File Size : 3.6 MB
File Modification Date/Time : 2019:11:24 01:11:52+05:30
File Access Date/Time : 2019:11:24 01:12:00+05:30
File Inode Change Date/Time : 2019:11:24 01:11:54+05:30
File Permissions : rw-r--r--
File Type : PDF
File Type Extension : pdf
MIME Type : application/pdf
PDF Version : 1.4
Linearized : No
Page Count : 54
Producer : Mac OS X 10.11.6 Quartz PDFContext
Creator : LaTeX with hyperref package
Create Date : 2018:05:01 19:56:31Z
Modify Date : 2018:05:01 19:56:31Z
现在我问一种可以添加超链接等字段的方法(这样我就可以记住从哪里下载特定文件),或者这样我总是可以知道/参考或找出谁共享了内容/pdf 文件与我一起。我确实看到了 pdftk 的联机帮助页,或者更确切地说是 Debian 中的 pdftk-java 的联机帮助页。有一个叫做但共享的示例并不能让我轻松理解应该如何使用它。有人可以帮忙吗?from : [email protected]
update_info
答案1
首先,您必须导出相关文件的元数据。命令
pdftk file.pdf dump_data output metadata
将生成metadata
一个包含 的所有元数据的文件file.pdf
。在此文件中,您将找到以下形式的结构:
...
InfoBegin
InfoKey: Creator
InfoValue: pdftk 3.0.2 - www.pdftk.com
...
您可以通过添加以下行来创建自己的元数据密钥
InfoBegin
InfoKey: Hyperlink
InfoValue: [email protected]
到文件。最后,您需要更新file.pdf
with的元数据
pdftk file.pdf update_info metadata output file2.pdf
请注意,后者会生成一个新文件file2.pdf
。现在,您有两个文件:file1.pdf
没有添加的元数据和file2.pdf
带有自定义元数据密钥。您可以使用exiftool
返回的命令检查一切是否顺利
...
Hyperlink : [email protected]
Modify Date : 2019:10:08 18:42:36+02:00
Creator : pdftk 3.0.2 - www.pdftk.com
Create Date : 2019:10:08 18:42:36+02:00
...
答案2
您可以使用 pdftk 将文档页面复制到新的 PDF 中,从而从文档中删除所有 Info 和 XMP 元数据,如下所示:
pdftk A=mydoc.pdf cat A 输出 mydoc.no_metadata.pdf