在 PDF 文件的“获取信息”屏幕下,更多信息,如何删除“编码软件”和“来自哪里”的元数据?
如果我在 Acrobat XI Pro(Mac)中打开此 PDF 并打开文件/属性/说明/附加元数据,则:
---“编码软件”确实出现了,但无法删除。
--- “Where From” 根本找不到。在 PDF 中也根本无法搜索到。
这个问题元数据存储在哪里?
如何删除这个问题元数据?(而不必诉诸“删除隐藏信息”,这会删除所有元数据,甚至是我想要保留的字段)。
答案1
Where From 元数据是 Mac 文件系统属性,而不是 PDF 的属性。可以使用以下命令将其删除:
xattr -d com.apple.metadata:kMDItemWhereFroms FILE_NAME
有关详细信息,请查看此问题https://apple.stackexchange.com/questions/110239/where-is-the-where-from-meta-data-stored-when-downloaded-via-chrome
答案2
要从 PDF 中删除/更新“编码软件”:
- 转到你的终端并运行
pip install pypdf2
- 创建一个名为覆盖.py和:
import pprint
from PyPDF2 import PdfFileReader, PdfFileMerger
if __name__ == '__main__':
file_in = open('old.pdf', 'rb')
pdf_reader = PdfFileReader(file_in)
metadata = pdf_reader.getDocumentInfo()
pprint.pprint(metadata)
pdf_merger = PdfFileMerger()
pdf_merger.append(file_in)
pdf_merger.addMetadata({
'/Producer': 'Leave empty to remove',
})
file_out = open('new.pdf', 'wb')
pdf_merger.write(file_out)
file_in.close()
file_out.close()
代码来源:https://stackoverflow.com/a/58222282/1895600
- 将您的 pdf 文件复制到当前目录中,文件名为:
old.pdf
- 跑步
python override.py
将使用上面脚本中提供的“编码软件”值创建一个新文件。
干杯!