无法使用 pdfimages 从 pdf 中提取图像

无法使用 pdfimages 从 pdf 中提取图像

我正在尝试从 PDF 中提取图像pdfimages。上次我使用它时没有任何问题,但现在我无法完成这项工作。

当我跑步时

pdfimages archive.pdf .

ls我在 pdf 所在的文件夹中尝试,但什么也没得到。我ls -a发现了隐藏文件,例如.-000.ppm

为什么会pdfimages产生这样的输出?我怎样才能再次获得图像?

答案1

手册页pdfimages

pdfimages [options] PDF-file image-root

所以,你的命令

pdfimages archive.pdf .

指示pdfimages创建文件名以.- 开头的输出文件,这正是所发生的情况,只是此类文件名恰好在 Unix/Linux 中具有特殊含义。

您可以使用更方便的参数值重新运行该命令image-root,或者重命名(非自愿的)隐藏文件,这些文件仍应包含正确的输出(即提取的图像)。

答案2

查看 pdfimages 联机帮助页。第二个参数“image-root”是前缀。您告诉 pdfimages 在提取的图像前添加一个点。它们是完全有效的图像文件名,尽管是隐藏的。您可以继续按原样使用它们。

相关内容