从 .pdf 文件中删除识别信息以供同行评审

从 .pdf 文件中删除识别信息以供同行评审

我正在使用最新版本的 TeXShop for Mac 采用默认设置。

我有可能通过该软件生成的 .pdf 文件(例如通过 .pdf 元数据)被识别吗?我必须采取什么措施来确保这种情况不会发生?(当然,我不会在文档本身的文本中包含任何识别信息。)

我之所以问这个问题,是因为我有效地对学术期刊进行同行评审的能力取决于我制作匿名报告的能力,并且我希望能够使用 LaTeX 毫无顾虑地做到这一点。

答案1

一般来说这应该不是问题。但是你需要注意潜在的问题。我经常恢复不应该存在的数据。有一次,我追踪了几个连续编辑文档的用户,以通知他们感染了病毒。此外,我还必须向用户解释如何从 pdf“历史记录”中恢复以前的编辑。

有一项研究表明,同行评审过程可能会泄露个人信息。我在某个答案中用到了它。如果我没记错的话,主要原因是重复编辑,而不是替换完整内容,只是将部分内容标记为已删除,因此有些人因编辑不当而受到指责。

这在很大程度上取决于所使用的编辑过程。因此,使用正确的设置可以生成没有元数据的简单 PDF。新 TeX 的首次运行(或几次运行)编译不应包含太多个人详细信息。

最常见的泄露是构建的嵌入位置,因此假设你在如下文件夹中构建文件

c:\users\user179408\我的秘密乳胶恋物癖\documents

你的文件可能包含这样的嵌入赠品,这里是亚历克斯谁使用过 powerpoint

pdf:Producer='Acrobat Distiller 5.0.5 (Windows)' pdf:Author='alex' pdf:Creator='PScript5.dll 版本 5.2.2' pdf:Title='Microsoft PowerPoint - 08_Image Filtering_09.ppt'/> http://ns.adobe.com/xap/1.0/' xmlns:xap='http://ns.adobe.com/xap/1.0/' xap:CreateDate='2009-03-08T04:54:19Z' xap:ModifyDate='2009-03-08T04:54:19Z' xap:Author='alex' xap:MetadataDate='2009-03-08T04:54:19Z'>

这是来自 MiKTeX 的一份简单 pdf,除了版本之外,几乎没有提供其他信息。因此,它相对干净。

在此处输入图片描述

https://zdoc.site/security-and-privacy-issues-in-the-portable-document-format-.html
上面的摘录还指出,您可以通过一些最近的 pdf 来追踪读者数量。

工业与应用数学学会保护裁判个人信息

PDFa 组织的另一篇描述错误删节的文章


总之,使用基本的 TeX 编译,几乎无需担心,通常是后续的后期处理或包含可能危及隐私的 PDFa 元数据。

相关内容