使用 pdfimages 提取图像时出现问题

Question

请注意，您的 PDF 包含每个页面的图像，并且每个图像包含整个扫描仪区域。 PDF 可以通过转换、缩放等方式仅显示其实际拥有的信息的一部分......

获取页面的另一种方法是：

$ pdftoppm -cropbox -jpeg file.pdf prefix

这将获取图像并根据 pdf 文件中的“裁剪框”裁剪它们（请参阅下面的评论）。

Answer 1

请注意，您的 PDF 包含每个页面的图像，并且每个图像包含整个扫描仪区域。 PDF 可以通过转换、缩放等方式仅显示其实际拥有的信息的一部分......

获取页面的另一种方法是：

$ pdftoppm -cropbox -jpeg file.pdf prefix

这将获取图像并根据 pdf 文件中的“裁剪框”裁剪它们（请参阅下面的评论）。

相关内容