我见过 PDF 文件被锁定,因此无法复制文本,但可以突出显示。我尝试了几种 PDF 阅读器(其中一些是开源的),它们都遵守锁定。这是一种加密形式吗?如果是,我如何选择文本,但不能复制它?或者它只是一种依赖读者遵守的锁定?
对于锁定的 .ppt 文件也有同样的问题。我甚至无法使用 OpenOffice 打开它们。使用 Powerpoint,我可以以“只读”方式打开它们。
再次,内容真的加密了吗?如果是,我如何选择文本,但不能复制它?信息如何加密,但可见且可选?我想如果它被加密了,它不应该是可选的,而应该像图像一样融入页面。
那么,它是像 Windows 登录那样的访问密码吗?如果您从另一个驱动器启动,它就无关紧要了?还是它是真正的加密,人们无法绕过它?
答案1
如果你看不懂无需提供密码,它已加密(话虽如此,早期版本的 Office 和 Acrobat 算法确实很弱。现代版本倾向于使用 AES。)
如果你能读懂无需密码,但必须提供密码才能修改,则该文件仅仅是锁定。根据格式,可能只需用十六进制编辑器或者修改阅读器本身;例如 Evince 有一个忽略 PDF 限制的设置。(但请参见下文↓。)
- (那里是密码也有可能被用于身份验证/完整性检查,使用了一些哈希值,但我不记得有什么方案可以允许确认因为不知道密码,所以这种情况不太可能发生。)
但别忘了,作者可能只是嵌入了图像文本的格式,而不是文本本身。PDF 可能来自扫描仪。也许它不是 PDF,而是 PostScript.ps
文档,介于文本和图像之间。
↓不过这一点……
我想如果它被加密了,它就不应该被选择,而应该像图像一样融入页面中。
...部分是无稽之谈,但部分是一个有趣的想法。
一方面,加密不会改变数据的工作方式。如果你加密一个文本文档(例如 PDF 文件),然后解密它,你得到完全相同的字节– 您获得的是原始文档,而不是它的平面图像。
话虽如此,可以以这种方式工作 – 文档很容易嵌入两个版本:任何人都可以读取的渲染图像,以及只有使用密码才能读取(因此可以修改)的加密原始图像。要修改文档,您需要解密原始文档,对其进行编辑,然后再次渲染到图像中。
我知道 Office 文档不这样做——修改密码只是一把锁。我对 PDF 不太确定。
但我也对此表示怀疑,因为这种双重文件方案确实重大漏洞:有人仍然可以用 Photoshop 处理图片直接地,而且由于原始文件已加密,因此无法检测到。
答案2
我记得很久以前读过 PDF 规范,要求读者遵守密码限制,但规范提供了足够的信息让他们忽略它。
PPT 密码与 PDF 类似...文件中有一些数据告诉 PowerPoint 应用程序“在打开此文件之前要求用户输入密码”。文件中的数据未加密。