我从一个网站下载了这个 PDF 文件,大小为 350 KB,有 20 页。所有页面都是扫描图像。我使用 Adobe Acrobat Pro 提取了这些图像,它们总共大小为 1.32 MB(查看 > 工具 > 文档处理 > 导出所有图像)。我将它们转换为单个 PDF 文件(1.28 MB)。如何将这些图像合并为一个小尺寸的 PDF 文件?
我需要使用软件缩小扫描图像的尺寸吗?那么我该怎么做才能获得 350 KB PDF 文件的质量呢?
事实上,我定期扫描一些文档并将它们转换为 PDF,并且我想让它们尽可能的小。
我尝试过的:
- 在 Adobe Acrobat Pro 中:文件 > 另存为其他 > 缩小尺寸的 PDF
- 在 Adobe Acrobat Pro 中:文件 > 打印 > 选中“以灰度打印”复选框
更新:由于侵犯版权,链接已被删除!
答案1
您所做的只是一次有用的练习。否则,像这样从 PDF 中导出图像并根据这些图像创建新的 PDF 是没有意义的。
原文档空间使用量为:
Description Bytes Percentage
Images 351,829 97.60 %
Content Streams 2,742 0.76 %
Document Overhead 5,916 1.64 %
Total 360,478 100 %
您的文档的空间使用量为:
Description Bytes Percentage
Images 1,329,944 98.87 %
Bookmarks 21 0.00 %
Content Streams 1,675 0.12 %
Structure info 60 0.00 %
Document Overhead 13,389 1.00 %
Total 1,345,089 100 %
原始文档不是用 Acro 创建的,但是文本这解释了缺失的结构信息。
在“文档处理”下,您有一个单独的工具“优化扫描的 PDF”。我按照您的工作流程,在新创建的 PDF 上运行了优化器,生成的文件大小为 328KB。但是质量明显比原始文档差。
这是意料之中的,因为我所做的一切都是默认设置。这意味着图像导出已经是 jpg 格式,而 jpg 格式比 PDF 格式大。我通过将每一页提取到单个 PDF 中进行了测试 - 例如,从第 1 页导出的 jpg 图像为 22KB,而导出为 PDF 时只有 9KB。在新文档中进一步优化图像会使图像质量进一步下降。对于 jpg 等位图图像格式来说,这是不可避免的。
上面的尺寸使用情况表明 Acrobat 显然以最高的质量导出了图像。这是有道理的,因为当您这样做时,您希望以最少的图像数据损失导出它们。
一个选项可能是对文件进行 OCR,将图像转换为文本,文本文件比图像膨胀要轻得多。Acro Pro 包含 OCR 工具,但我无法测试它,因为我没有阿拉伯语。
编辑:扩展语言包仅适用于 Adobe Reader。经过一番研究,似乎 Acrobat 不支持阿拉伯语 OCR。请参阅此Adobe 论坛讨论。
扫描成 PDF 然后进行优化总是需要在大小和质量之间进行权衡。您只需使用不同的设置(原始扫描和优化)进行测试,即可找到令人满意的折衷方案。