我有 pdf 文件,需要将其转换为其他格式。这些文件包含图像和文本。我需要图片。
我尝试使用 abiword 进行转换,但不幸的是结果只得到了文本。
我使用的命令:
abiword --to=doc file.pdf
我认为“odt”格式是最好的。除非有其他方法可以绘制相同的图片。
答案1
如果只需要从 PDF 文件中提取几个数字,则可以使用基于 GUI 的方法,只有当您有照片编辑器时才有可能(您很可能安装了 GIMP)。下面是操作的详细过程(如果您是这方面的专家,请原谅我,但这可能对其他人来说是一个不错的参考):
- 打开 pdf 文件,将一张图片放在屏幕上,使其覆盖大部分屏幕(例如,如果您使用的是 Evince,只需按 F11 并调整缩放)。(屏幕上的图片越大,提取的文件的质量越好)
- 按下键盘上的 Print Screen 键。
- 选择
Open with: your favorite photo editor
(可能是 GIMP)。 - 使用矩形选择工具选择要提取的图片区域。要启用此工具,请使用工具箱面板或按R。选择区域后,使用Ctrl+复制它,然后使用+ +C将其粘贴为新图像。然后,从文件菜单中选择导出为,或按+ + 。然后,您可以以任何您喜欢的格式保存图片。只需更改扩展名或在底部菜单中选择即可。ShiftCtrlVShiftCtrlE
如果你有很多图片需要提取,或者你更喜欢命令行方法,使用该pdfimages
工具。要使用它,请安装软件包poppler-utils
(您可能已经拥有它):
sudo apt-get install poppler-utils
然后,打开一个终端窗口,转到 pdf 文件所在的文件夹,然后运行:
pdfimages -j file.pdf photo
这将从中提取图片file.pdf
并将其保存为photo-001.jpg
、photo-002.jpg
等(在 pdf 文件所在的同一文件夹中)。
答案2
使用 OpenOffice/LibreOffice 打开 pdf 文件,删除文本并将文件另存为 odt。odt 表示“打开文档文本”文件。它是 OpenOffice 的原生格式。