无法使用 Adob​​e Reader 从受保护的 PDF 文件中复制文本

无法使用 Adob​​e Reader 从受保护的 PDF 文件中复制文本

我有一份来自第三方来源的技术 PDF 文档,需要从中复制少量复杂文本。我选择了文本,发现复制选项呈灰色。我查看了属性,似乎有禁止复制的保护。我想复制文本,而不是重新输入,因为它有点复杂,我想避免拼写错误。

答案1

如果这个 pdf 不是图片,使用 pdftotext 命令。它是 Ubuntu 的内置实用程序。如果 pdf 是图片文件,则需要将其转换为 jpg,然后使用 tesseract 识别它。

convert-im6.q16 -density 300 yourfile.pdf yourfile.jpg
tesseract -l en youfile.pdf

答案2

在其他 PDF 应用程序(例如浏览器)中打开文件可以简单绕过可能应用于 PDF 的某些保护。

如果 PDF 内容是图片(例如,它是扫描的),这可能不起作用,您需要一个具有 OCR(光学字符识别)的工具来分析图片并从中生成文本。

相关内容