文件的来源可追溯吗?如果可以,我该如何清理它?

文件的来源可追溯吗?如果可以,我该如何清理它?

如果我将文件从我的电脑复制到一个新格式化的 USB 闪存驱动器,将文件带到公共电脑和公共互联网连接上,从那里创建一个新的电子邮件,在上传服务器上创建一个新帐户,上传该文件,在网络上共享此文件的下载链接,然后匿名个人或组织下载了该文件,该文件是否会被此人或组织追踪?

另外,如果这个文件不是我的 PDF 文件,而是我从别人那里拿来的,我该如何让这个文件无法追踪呢?

答案1

文件的来源可追溯吗?如果可以,我该如何清理它?

简短的回答是,这取决于:

  • 如果文件包含您的姓名、地址、电话号码和社会安全号码追溯到你并不会很困难……

  • 许多申请都会留下某种身份信息,即元数据- 除了文件本身中明显可见的数据之外,还存在于文件中。

  • 元数据通常可以从文件中删除(删除方法取决于文件的类型)。

  • 上传文件将仅发送主数据流,并留下备用数据流和文件系统驻留元数据。

  • 正如安德鲁·莫顿一些组织在分发文件之前会对每个副本进行一些语法(或其他)上的细微修改。

    这样,如果副本被盗(或被传播),就可以追踪到特定个人。当然,这是很难破解的。

  • 继续阅读,了解有关与不同类型的文件相关联的敏感和隐藏数据类型以及如何清理(净化)它们的更多信息。


纯文本文件使用安全吗?

正如乌韦齐根哈根,即使是 NTFS 文件系统上的 Windows 纯文本文件(以及任何其他文件类型)也可能包含元数据,其形式为备用数据流。 也可以看看如何使用 NTFS 备用数据流

备用数据流允许文件与多个数据流相关联。例如,text.txt 等文件可以具有名为 text.txt:secret.txt(格式为 filename:ads)的 ADS,只有知道 ADS 名称或使用专门的目录浏览程序才能访问该 ADS。

替代流无法通过原始文件的大小检测到,但当原始文件(即 text.txt)被删除时,或者当文件被复制或移动到不支持 ADS 的分区(例如 FAT 分区、软盘或网络共享)时,替代流就会丢失。虽然 ADS 是一项有用的功能,但如果由于被遗忘或未被检测到而未知,它也很容易占用硬盘空间。

仅当文件位于 NTFS 驱动器上时才支持此功能。

来源UltraEdit 文件打开对话框


查看和删除备用数据流

笔记:

  • NTFS 文件系统上的任何文件都可以附加备用数据流(不仅仅是文本文件)。
  • 有关与备用数据流相关的潜在安全问题的更多信息,请参阅隐藏的威胁:备用数据流

可以使用 Notepad 和 Word(从命令行)打开和读取备用数据流。请参阅此答案NTFS 备用数据流经过西了解更多信息。

超级编辑可以从程序内部打开备用数据流。

替代流视图可用于删除备用数据流:

替代流视图是一个小型实用程序,可让您扫描 NTFS 驱动器并查找存储在文件系统中的所有隐藏的备用流。

扫描并找到替代流后,您可以将这些流提取到指定的文件夹中,删除不需要的流,或者将流列表保存到文本、HTML、CSV 或 XML 文件中。

在此处输入图片描述

来源替代流视图经过尼尔软件


图像怎么样?

正如斯科特图像还可以包含隐藏数据(文件、消息、另一幅图像或视频,使用隐写术

隐写术包括将信息隐藏在计算机文件中。在数字隐写术中,电子通信可能包括传输层内的隐写编码,例如文档文件、图像文件、程序或协议。

由于媒体文件体积巨大,因此非常适合采用隐写传输。例如,发送者可能从一个无害的图像文件开始,然后调整每 100 个像素的颜色以对应字母表中的字母,这种变化非常微妙,以至于不仔细观察的人不太可能注意到它。

来源隐写术

当然,这是很难消除的。

也可以看看隐写术——一种数据隐藏技术速记软件


那么 Excel 电子表格或 Word 文档呢?

默认情况下,办公文档包含个人信息:

  • 该信息可以被删除,见下面的链接。

单词:

  • 考虑使用纯文本文件,使用记事本或其他编辑器创建,而不是使用 word 文档

电子表格:

  • 考虑使用CSV文件,用 excel 创建并保存为 CSV,或者直接用记事本等其他程序创建 CSV。

Word 文档可能包含以下类型的隐藏数据和个人信息:

  • 评论、修订标记、版本和墨迹注释

    如果您与其他人合作创建了文档,则文档中可能包含诸如修订标记、批注、墨迹注释或版本等项目。此信息可使其他人看到处理文档的人员姓名、审阅者的批注以及对文档所做的更改。

  • 文档属性和个人信息

    文档属性(也称为元数据)包含有关文档的详细信息,例如作者、主题和标题。文档属性还包括由 Office 程序自动维护的信息,例如最近保存文档的人员的姓名和文档的创建日期。如果您使用了特定功能,您的文档可能还包含其他类型的个人身份信息 (PII),例如电子邮件标题、发送以供审阅信息、路由单和模板名称。

  • 页眉、页脚和水印

    Word 文档的页眉和页脚中可以包含信息。此外,您可能已在 Word 文档中添加了水印。

  • 隐藏文字

    Word 文档可以包含格式为隐藏文本的文本。如果您不知道文档是否包含隐藏文本,可以使用文档检查器进行搜索。

  • 文档服务器属性

    如果您的文档保存到文档管理服务器上的某个位置(例如文档工作区网站或基于 Microsoft Windows SharePoint Services 的库),则该文档可能包含与此服务器位置相关的其他文档属性或信息。

  • 自定义 XML 数据

    文档可以包含文档本身不可见的自定义 XML 数据。文档检查器可以找到并删除此 XML 数据。

笔记:

  • Word 文档检查器无法检测带有隐写术(隐藏文件、消息、图像或视频)

来源通过检查文件删除隐藏数据和个人信息


如果我使用从其他人那里获得的 PDF 文件该怎么办?

PDF 不安全:

  • 它们可能含有病毒,参见PDF 文件可能含有病毒吗?

  • 它们可以包含 JavaScript。如果每次打开 PDF 时 JavaScript 都会“打电话回家”,那么可能会留下一条包含您的 IP 地址的痕迹。

  • PDF 还可能包含隐藏信息:

    PDF 也经常被用作最初在 Microsoft Office 中创建的文件的分发格式,因为隐藏的数据和元数据可以在转换过程中被清理(或编辑)。

    尽管 PDF 文档用途广泛,但分发这些文件的用户往往低估了其中可能包含隐藏数据或元数据的可能性。本文档列出了 PDF 文档可能存在的风险,并提供了可帮助用户减少敏感信息无意泄露的指南。

来源Adobe PDF 文件中的隐藏数据和元数据:
发布风险及对策
,由美国国家安全局


我如何检查 PDF 文件以确保它不包含任何敏感信息?

您可以遵循美国国家安全局净化你的 PDF。

  • 我总结了您需要遵循的基本步骤。
  • 下面的链接提供了带有屏幕截图的详细分步说明。

本文介绍了对 PDF 文档进行静态发布的清理程序。本文档中的清理是指删除不打算发布的隐藏数据和动态内容(例如,作者的用户名或嵌入在文件中但在任何页面上不可见的临时编辑注释)。

隐藏数据包括:

  • 元数据

  • 嵌入内容和附加文件

  • 脚本

  • 隐藏层

  • 嵌入式搜索索引

  • 存储的交互式表单数据

  • 审阅和评论

  • 隐藏页面、图片和更新数据

  • 模糊的文本和图像

  • PDF(不显示)评论

  • 未引用的数据

...

详细消毒程序

  1. 净化源文件

    如果生成源文件的应用程序具有清理实用程序,则应在转换为 PDF 之前应用该实用程序。

  2. 配置安全设置

    • 确保已下载并安装所有适用的 Acrobat 更新
    • 禁用 JavaScript
    • 验证信任管理器设置是否正确设置
  3. 运行预检

    预检可确保文件内容与目标版本兼容,并根据需要应用“修复”。

  4. 运行 PDF 优化器

    • 如果 PDF 文件包含其他附件,则会出现警告消息。单击“确定”继续。PDF 优化期间将删除附件。
    • 文档标签会带来隐藏的数据风险。此过程(特别是选中“丢弃文档标签”选项)会将其从已清理的 PDF 中删除。
  5. 运行检查文档实用程序

    • 这有助于找到隐藏在物体后面的文本以及前面步骤中可能遗漏的任何其他区域。

来源Adobe PDF 文件中的隐藏数据和元数据:
发布风险及对策
,由美国国家安全局


但是我有防病毒软件!

即使是防病毒软件也不能保证能查出所有问题。请参阅零日开发:

零日漏洞(也称为零时或 0 天)是一种以前未公开的计算机软件漏洞,黑客可以利用该漏洞对计算机程序、数据、其他计算机或网络造成不利影响。

它之所以被称为“零日漏洞”,是因为一旦该漏洞被人发现,软件作者就没有时间制定计划并提出任何缓解措施来防止漏洞被利用(例如,通过建议解决方法或发布补丁)

来源零日


我的 USB 驱动器怎么办?我需要担心这个吗?

您无法保证您的 USB 闪存驱动器是安全的。

可以对 USB 外围设备(例如拇指驱动器)进行重新编程,以窃取写入驱动器的任何内容,并将固件修改代码传播到它接触的任何 PC。最终结果可能是自我复制的病毒通过备用拇指驱动器传播,就像几十年前通过软盘传播的初级病毒一样。

来源为什么你的 USB 设备存在安全风险

答案2

这取决于文件类型。例如,所有 Microsoft Office 应用程序(Word、Excel 等)都会在文件中存储以下信息:

  • 计算机名称(文件保存的位置)
  • 作者姓名(默认情况下,为 Microsoft Office 注册人的姓名,但可以轻松更改)
  • 文件记入的日期
  • 文件上次保存的日期

上述信息通常被称为文件元数据。

如果将文档保存为纯文本文件,即 document.TXT(用记事本打开),则不会保存任何元数据。

小心对待:)

相关内容