将pdf转换为可编辑格式,保留图像

将pdf转换为可编辑格式,保留图像

我有 pdf 文件,需要将其转换为其他格式。这些文件包含图像和文本。我需要图片。

我尝试使用 abiword 进行转换,但不幸的是结果只得到了文本。

我使用的命令:

abiword --to=doc file.pdf

我认为“odt”格式是最好的。除非有其他方法可以绘制相同的图片。

答案1

如果只需要从 PDF 文件中提取几个数字,则可以使用基于 GUI 的方法,只有当您有照片编辑器时才有可能(您很可能安装了 GIMP)。下面是操作的详细过程(如果您是这方面的专家,请原谅我,但这可能对其他人来说是一个不错的参考):

  • 打开 pdf 文件,将一张图片放在屏幕上,使其覆盖大部分屏幕(例如,如果您使用的是 Evince,只需按 F11 并调整缩放)。(屏幕上的图片越大,提取的文件的质量越好)
  • 按下键盘上的 Print Screen 键。
  • 选择Open with: your favorite photo editor(可能是 GIMP)。
  • 使用矩形选择工具选择要提取的图片区域。要启用此工具,请使用工具箱面板或按R。选择区域后,使用Ctrl+复制它,然后使用+ +C将其粘贴为新图像。然后,从文件菜单中选择导出为,或按+ + 。然后,您可以以任何您喜欢的格式保存图片。只需更改扩展名或在底部菜单中选择即可。ShiftCtrlVShiftCtrlE

如果你有很多图片需要提取,或者你更喜欢命令行方法,使用该pdfimages工具。要使用它,请安装软件包poppler-utils(您可能已经拥有它):

sudo apt-get install poppler-utils

然后,打开一个终端窗口,转到 pdf 文件所在的文件夹,然后运行:

pdfimages -j file.pdf photo

这将从中提取图片file.pdf并将其保存为photo-001.jpgphoto-002.jpg等(在 pdf 文件所在的同一文件夹中)。

答案2

使用 OpenOffice/LibreOffice 打开 pdf 文件,删除文本并将文件另存为 odt。odt 表示“打开文档文本”文件。它是 OpenOffice 的原生格式。

相关内容