如何提取 PDF 的页面范围/一部分？

Question 1

pdftk是一款实用的多平台工具（pdftk 主页）。

pdftk full-pdf.pdf cat 12-15 output outfile_p12-15.pdf

您传递主 pdf 的文件名，然后告诉它仅包含某些页面（此示例中为 12-15）并将其输出到新文件。

安装说明：

要安装 snap 版本（PDFtk 旧版本的非官方重新打包版本，由 Scott Moser 重新打包），请访问此链接或者运行：

sudo snap install pdftk

或者，您可以通过运行以下命令安装 Marc Vinyals 编写的 PDFtk 到 Java 的开源端口：

sudo apt install pdftk-java

另一个选择是 PDFtk Server，可从以下网站获取：https://www.pdflabs.com/tools/pdftk-server/。该版本可供个人使用免费，但是不开源。

Answer

pdftk是一款实用的多平台工具（pdftk 主页）。

pdftk full-pdf.pdf cat 12-15 output outfile_p12-15.pdf

您传递主 pdf 的文件名，然后告诉它仅包含某些页面（此示例中为 12-15）并将其输出到新文件。

安装说明：

要安装 snap 版本（PDFtk 旧版本的非官方重新打包版本，由 Scott Moser 重新打包），请访问此链接或者运行：

sudo snap install pdftk

或者，您可以通过运行以下命令安装 Marc Vinyals 编写的 PDFtk 到 Java 的开源端口：

sudo apt install pdftk-java

另一个选择是 PDFtk Server，可从以下网站获取：https://www.pdflabs.com/tools/pdftk-server/。该版本可供个人使用免费，但是不开源。

Question 2

非常简单。使用默认的 PDF 阅读器，选择“打印到文件”，就完成了！

打印菜单

然后：

设置新的 PDF

请注意，通过这种方式，文本将不再可搜索，而是所有文本都转换为图像：这就是“打印”的工作方式。

Answer

非常简单。使用默认的 PDF 阅读器，选择“打印到文件”，就完成了！

打印菜单

然后：

设置新的 PDF

请注意，通过这种方式，文本将不再可搜索，而是所有文本都转换为图像：这就是“打印”的工作方式。

Question 3

定量PDF很棒。用这种方法提取第 1 至第 10 页input.pdf并将其保存为output.pdf：

qpdf input.pdf --pages . 1-10 -- output.pdf

这将保留与该文件相关的所有元数据。

来自旧手册：

如果你想要 infile.pdf 中的第 1 到第 5 页，但希望删除其余的元数据，你可以运行

qpdf --empty --pages infile.pdf 1-5 -- outfile.pdf

以下是链接到当前文档，给出更多页面选择的示例。

您可以通过调用以下命令来安装它：

sudo apt-get install qpdf

它是一款出色的 PDF 操作工具。它非常快，依赖关系很少。来自QPDF 的 GitHub 存储库：

QPDF 是一个命令行工具和 C++ 库，可对 PDF 文件执行内容保留转换。它支持线性化、加密和许多其他功能。它还可用于拆分和合并文件、创建 PDF 文件（但您必须自己提供所有内容）以及检查文件以进行研究或分析。

Answer

定量PDF很棒。用这种方法提取第 1 至第 10 页input.pdf并将其保存为output.pdf：

qpdf input.pdf --pages . 1-10 -- output.pdf

这将保留与该文件相关的所有元数据。

来自旧手册：

如果你想要 infile.pdf 中的第 1 到第 5 页，但希望删除其余的元数据，你可以运行

qpdf --empty --pages infile.pdf 1-5 -- outfile.pdf

以下是链接到当前文档，给出更多页面选择的示例。

您可以通过调用以下命令来安装它：

sudo apt-get install qpdf

它是一款出色的 PDF 操作工具。它非常快，依赖关系很少。来自QPDF 的 GitHub 存储库：

QPDF 是一个命令行工具和 C++ 库，可对 PDF 文件执行内容保留转换。它支持线性化、加密和许多其他功能。它还可用于拆分和合并文件、创建 PDF 文件（但您必须自己提供所有内容）以及检查文件以进行研究或分析。

Question 4

将其保存为 shell 脚本，例如 pdfextractor.sh：

#!/bin/bash
# this function uses 3 arguments:
#     $1 is the first page of the range to extract
#     $2 is the last page of the range to extract
#     $3 is the input file
#     output file will be named "inputfile_pXX-pYY.pdf"
gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -dSAFER \
   -dFirstPage="${1}" \
   -dLastPage="${2}" \
   -sOutputFile="${3%.pdf}_p${1}-p${2}.pdf" \
   "${3}"

运行类型：

./pdfextractor.sh 4 20 myfile.pdf

4指的是该页面它将启动新的pdf。
20指的是 pdf 的结束页面。
myfile.pdf是您要提取部分的pdf文件。

输出将位于myfile_p4_p20.pdf原始 pdf 文件所在的目录中。

所有这些以及更多信息请参见此处：技术提示

Answer

将其保存为 shell 脚本，例如 pdfextractor.sh：

#!/bin/bash
# this function uses 3 arguments:
#     $1 is the first page of the range to extract
#     $2 is the last page of the range to extract
#     $3 is the input file
#     output file will be named "inputfile_pXX-pYY.pdf"
gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -dSAFER \
   -dFirstPage="${1}" \
   -dLastPage="${2}" \
   -sOutputFile="${3%.pdf}_p${1}-p${2}.pdf" \
   "${3}"

运行类型：

./pdfextractor.sh 4 20 myfile.pdf

4指的是该页面它将启动新的pdf。
20指的是 pdf 的结束页面。
myfile.pdf是您要提取部分的pdf文件。

输出将位于myfile_p4_p20.pdf原始 pdf 文件所在的目录中。

所有这些以及更多信息请参见此处：技术提示

如何提取 PDF 的页面范围/一部分？

答案1

安装说明：

答案2

答案3

答案4

相关内容