如何从 Windows 命令行提取 PDF 的第 3、4、5 页?

如何从 Windows 命令行提取 PDF 的第 3、4、5 页?

注意:我已经找到了适用于 Linux 的解决方案(请参阅如何提取一个大pdf文件的所有页面?) 或使用 Python 的解决方案,或使用免费软件 GUI 工具的解决方案。

如何从 Windows 上的命令行(无 GUI 工具)从 PDF 中提取特定页面并保留原始格式(即,如果它是文本输入 PDF,则输出不应该是图像 PDF)?

我已经尝试过使用 ImageMagick:

convert input.pdf[2,3,4] output.pdf                # numbering begins at 0, so [2,3,4] is for pages 3,4,5

并且它可以工作,但输出文件是一个包含图片,所以它比输入大得多,并且您无法在输出 PDF 中通过文本进行搜索。

答案1

如何从 Windows 上的命令行(无 GUI 工具)从 PDF 中提取特定页面并保留原始格式(即,如果它是文本输入 PDF,则输出不应该是图像 PDF)?

PDFtk(在接受的答案中提到的工具链接问题)可以做到这一点。它是一个跨平台实用程序,提供适用于 Windows 的版本。要从命令行执行操作,您需要PDFtk 服务器

看看命令行示例对于 PDFtk 服务器,示例命令将类似于:

pdftk input.pdf cat 3-5 output extracted.pdf

笔记

  • 经过测试,PDFtk Server 似乎可以从少量文本 PDF 中生成文本(即,“提取”的 PDF 中的文本可以正常突出显示、复制和搜索)。

  • 关于许可,PDFtk 服务器目前在 GPL 下发布

相关内容