使用图层蒙版从 PDF 中提取图像

使用图层蒙版从 PDF 中提取图像

我有一个带有图层蒙版(即透明胶片)的 PDF 文件,我需要提取图像的透明层。

当我使用pdfimages提取图像时 - .jpg 和 .png 都具有相同的白色不透明背景。ImageMagickconvert a.pdf image-%04d.png输出单个非分层文件。

任何帮助,将不胜感激。

答案1

看看这个:从 PDF 中删除文本信息?

为方便您使用,粘贴在此处:

开发办公室

安装PDF 导入扩展从 Oracle 导入到 OpenOffice 扩展管理器中,您将能够在 OpenOffice Draw 中打开和编辑 PDF 文件。这将创建所有元素(文本、线条、绘图等),您将能够删除不需要的元素。屏幕截图如下:

在此处输入图片描述

瘸子

如果您希望将 pdf 页面作为图层处理并将其作为图像进行编辑,那么您可以右键单击 PDF 文件并选择“使用 GIMP 图像编辑器打开”,打开 gimp 后将显示“从 PDF 导入”对话框,并允许您使用几个选项选择要编辑的页面,如下一张屏幕截图所示。

在此处输入图片描述

之后您还可以编辑这些页面,如以下屏幕截图所示:

在此处输入图片描述

祝你好运!

答案2

我认为图层蒙版是 PDF 的一部分,而不是图像的一部分。但是,您可以使用某个 PDF 库获取蒙版详细信息,然后使用其他图像处理库或工具将这些蒙版应用于提取的图像。

答案3

抄写员也会尝试打开 pdf 文件进行编辑。具体情况可能因 pdf 的创建方式而异。我经常需要将“检索”pdf 中被分割的多个图像拼接在一起。

此外,据我所知,jpeg 不支持透明度,并且我遇到的大多数 pdf 都将图像嵌入为 jpeg。

我只希望您所需的透明图像实际上是 svg 图形。如果是这样,您使用 Scribus 应该会非常成功。

相关内容