我正在尝试将文本从 PDF 复制到 Excel。问题是 PDF 受密码保护,无法使用复制功能。可以使用 Windows XPS 查看器、Onenote 和其他方法轻松复制文本。我需要 PDF 保持 PDF 格式,因为我有一个从 PDF 中提取数据的程序。所以我最初的想法是打开受保护的 PDF 并将其打印为另一个 PDF 以复制文本。
因此我尝试回答这里之前提出的问题:如何删除 PDF 文件的安全性?
而且它在互联网上已经发布了好几次,所以我假设它对其他人也有效。但是,当我删除以“mark currentfile eexec...cleartomark”开头的所有内容并保存,然后使用 Adobe 进行提取时,我收到了来自 Adobe 提取器的错误:
%%[ Error: undefined; OffendingCommand:  ]%%
%%[ Flushing: rest of job (to end-of-file) will be ignored ]%%
%%[ Warning: PostScript error. No PDF file produced. ] %%
我试图研究这个错误,但 OffendingCommand: 似乎不是一个常见的错误。
我为此过程采取的步骤:
- 打开受密码保护的 PDF
- 选择PDF打印驱动程序,勾选打印到文件
- .ps 文件已创建。我使用记事本打开并编辑 .ps 文件,并删除“mark currentfile...cleartomark”文本。
- 节省
- 双击文件会自动运行 Adobe Distiller 并且我收到上述消息。
有人能帮我解决我做错的事情吗?或者有其他想法吗?我无权尝试使用第三方软件来完全删除密码。
PS 我读到过,Adobe 在尝试打印到文件时会创建一个临时文件,有时可以将其重命名为“.pdf”以使其成为 PDF。这适用于这种情况吗?这会在哪个临时文件夹中?我尝试搜索我的计算机,但找不到大小相似的文件/我尝试过的文件,但没有成功。
答案1
我找到了答案。使用 Notepad++ 而不是 Notepad。当我保存已编辑的 .ps 时,Notepad 会改变一些东西,这在尝试使用 ghostscript 时会导致问题。