我的问题是我的任务是从 640 页的 PDF 文件中提取图像。
其中大部分都是带有文字的图表和表格。简单的复制和粘贴会使图像失去分辨率,文字变得模糊,有时甚至无法阅读。
您知道有没有更好的方法可以在不影响分辨率的情况下从 PDF 文件中提取图像?
答案1
来自 XPD 套件(免费开源软件)您可以使用pdfimages.exe
CLI 工具从 PDF 中提取所有图像,或者仅从一系列页面中提取所有图像。以下是从第 33-36 页中提取所有图像的示例:
pdfimages.exe ^
-f 33 ^
-l 36 ^
-j ^
c:/path/to/input.pdf ^
c:/path/to/directory/input_images
将-j
尝试将嵌入的 JPEG 图像提取为 JPEG。所有其他图像均输出为 PPM(便携式像素图)。注意,PPM 完全未压缩!
答案2
使用evince
Ubuntu 中的文档查看器非常容易。只需使用打开 pdf,evince
然后取消最大化窗口,Always on top
然后标记它拖放将图像放入您喜欢的文件夹中。
答案3
PHOTOSHOP!在 Photoshop 中打开 PDF。(在 Windows 7 上使用 Photoshop CC)
- 启动 Photoshop。
- 选择“文件/打开”(或 Command/Control-O)。“打开”对话框将会弹出。
- 选择 PDF 并点击 OK/Enter。将弹出“导入 PDF”对话框。
- 重要提示 - 在“选择”下,单击“图像”单选按钮。所有图像都会显示出来!
- 选择所需的图像并单击“确定”。
- 瞧!