从文档中提取 PDF 页面,但保持其可搜索

从文档中提取 PDF 页面,但保持其可搜索

我想将 PDF 文档中的第 1-50 页提取到另一个 PDF 文档中。我知道 Windows 有打印 > 另存为 PDF 或 Microsoft Prints PDF。这两个操作都会呈现巨大的图像,并且文本不再可搜索。

如果不下载 Adob​​e 等付费软件,我真的找不到解决方案(不行)。有没有办法在不使用第三方付费软件的情况下实现这一点?这似乎是一项非常基本的任务,但 Windows 并不真正支持。

答案1

可以使用PDFSAM Basic

PDFsam Basic 或 PDF Split and Merge 是一款免费的开源跨平台桌面应用程序,用于拆分、合并、提取页面、旋转和混合 PDF 文档。

->https://pdfsam.org/pdf-extract-pages/

在此处输入图片描述

答案2

您可以尝试安装ghostscript软件然后使用命令:

gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -dSAFER -dFirstPage=1 -dLastPage=50 -sOutputFile=OUTPUT.pdf ORIGINAL.pdf

您将创建包含前 50 页的新文件ORIGINAL.pdf

欲了解更多命令/调整,您可以阅读手动的ghostscript 的

答案3

尝试使用免费 PDF24 工具。我曾用它做过这样的工作,它确实完成了任务。

您可以使用“提取 PDF 页面”工具提取页面。或者,您可以使用“删除 PDF 页面”工具删除第 51 页及以后的页面。

由于该工具本身操作并保存原始 PDF 源代码,并且不会转换或创建任何内容,因此它应该可以更好地工作(除非 PDF 受密码保护)。

答案4

看看 PDFtkPDF 实验室

要从 input.pdf 中提取 1-50 页并创建 output.pdf,请尝试以下操作:

pdftk A=input.pdf cat A1-50 output output.pdf

甚至还有 Windows GUI。

相关内容