为了在 Gnu/Linux 机器上提取 PDF 页面的一部分,我使用以下命令:
gs -sDEVICE=pdfwrite -o out.pdf -g2300x2300 input.pdf
该-g...x...
选项允许我选择输入 PDF 上的坐标。所以,这是我的问题:
- 如何移动坐标以便选择输入 PDF 上的任何矩形?
并延伸这个问题:
- 有没有图形界面可以选择我想要的坐标? (到目前为止,这是一次尝试和错误。)
我不想从输入 PDF 中提取整个页面。
输出格式应再次为 PDF。我不是在寻找文本或图像的提取。
类似的问题已被问到askubuntu.org,但答案仅涉及提取整个页面或页面范围。我知道我可以做到这一点pdftk
。
有人提出了与此类似的更具体的问题之前在这里,但仍未得到答复。
在 Mac 上,整个事情绝对简单:程序preview
有一个专门用于此目的的函数。如何对单个 PDF 页面的一部分进行快照以输出 PDF 格式?
答案1
你可以pdfjam
尝试一下,它接受类似的参数--trim '1cm 2cm 1cm 2cm' --clip true
(以及 LaTeX 包“pdfpages”具有的更多参数)“分别从输入页面的左侧、底部、右侧和顶部修剪这些数量”,例如“--help”程序状态的输出。
答案2
我经常使用文档片段,但我还没有看到直接提取 pdf 片段的 GUI 方式。
也就是说,可以通过Okular
或 with进行精确的片段选择Spectacle
,并将结果保存为 png,我将其保存为 png知道你说你不想,但是......如果你在保存片段的目录上运行它,你可以回到pdfs
for i in *.png; do convert $i ${i%.*}.pdf; done
您引用的问题与“抓取文档的一部分”无关,而是在没有基点/绘图数据的情况下逆向工程曲线。与你提出的问题不同的动物。