从 Bash 中提取单个 PDF 页面的一部分

从 Bash 中提取单个 PDF 页面的一部分

为了在 Gnu/Linux 机器上提取 PDF 页面的一部分,我使用以下命令:

gs -sDEVICE=pdfwrite -o out.pdf -g2300x2300 input.pdf

-g...x...选项允许我选择输入 PDF 上的坐标。所以,这是我的问题:

  1. 如何移动坐标以便选择输入 PDF 上的任何矩形?

并延伸这个问题:

  1. 有没有图形界面可以选择我想要的坐标? (到目前为止,这是一次尝试和错误。)

我不想从输入 PDF 中提取整个页面。

输出格式应再次为 PDF。我不是在寻找文本或图像的提取。

类似的问题已被问到askubuntu.org,但答案仅涉及提取整个页面或页面范围。我知道我可以做到这一点pdftk

有人提出了与此类似的更具体的问题之前在这里,但仍未得到答复。

在 Mac 上,整个事情绝对简单:程序preview有一个专门用于此目的的函数。如何对单个 PDF 页面的一部分进行快照以输出 PDF 格式?

答案1

你可以pdfjam尝试一下,它接受类似的参数--trim '1cm 2cm 1cm 2cm' --clip true(以及 LaTeX 包“pdfpages”具有的更多参数)“分别从输入页面的左侧、底部、右侧和顶部修剪这些数量”,例如“--help”程序状态的输出。

答案2

我经常使用文档片段,但我还没有看到直接提取 pdf 片段的 GUI 方式。

也就是说,可以通过Okular或 with进行精确的片段选择Spectacle,并将结果保存为 png,我将其保存为 png知道你说你不想,但是......如果你在保存片段的目录上运行它,你可以回到pdfs

for i in *.png; do convert $i ${i%.*}.pdf; done

您引用的问题与“抓取文档的一部分”无关,而是在没有基点/绘图数据的情况下逆向工程曲线。与你提出的问题不同的动物。

相关内容