减小扫描图像的 PDF 文件的大小

减小扫描图像的 PDF 文件的大小

我从一个网站下载了这个 PDF 文件,大小为 350 KB,有 20 页。所有页面都是扫描图像。我使用 Adob​​e Acrobat Pro 提取了这些图像,它们总共大小为 1.32 MB(查看 > 工具 > 文档处理 > 导出所有图像)。我将它们转换为单个 PDF 文件(1.28 MB)。如何将这些图像合并为一个小尺寸的 PDF 文件?

我需要使用软件缩小扫描图像的尺寸吗?那么我该怎么做才能获得 350 KB PDF 文件的质量呢?

事实上,我定期扫描一些文档并将它们转换为 PDF,并且我想让它们尽可能的小。

我尝试过的:

  • 在 Adob​​e Acrobat Pro 中:文件 > 另存为其他 > 缩小尺寸的 PDF
  • 在 Adob​​e Acrobat Pro 中:文件 > 打印 > 选中“以灰度打印”复选框

更新:由于侵犯版权,链接已被删除!

答案1

您所做的只是一次有用的练习。否则,像这样从 PDF 中导出图像并根据这些图像创建新的 PDF 是没有意义的。

原文档空间使用量为:

Description        Bytes      Percentage
Images             351,829    97.60 %
Content Streams    2,742      0.76 %
Document Overhead  5,916      1.64 %
Total              360,478    100 %

您的文档的空间使用量为:

Description        Bytes      Percentage
Images             1,329,944  98.87 %
Bookmarks          21         0.00 %
Content Streams    1,675      0.12 %
Structure info     60         0.00 %
Document Overhead  13,389     1.00 %
Total              1,345,089  100 % 

原始文档不是用 Acro 创建的,但是文本这解释了缺失的结构信息。

在“文档处理”下,您有一个单独的工具“优化扫描的 PDF”。我按照您的工作流程,在新创建的 PDF 上运行了优化器,生成的文件大小为 328KB。但是质量明显比原始文档差。

这是意料之中的,因为我所做的一切都是默认设置。这意味着图像导出已经是 jpg 格式,而 jpg 格式比 PDF 格式大。我通过将每一页提取到单个 PDF 中进行了测试 - 例如,从第 1 页导出的 jpg 图像为 22KB,而导出为 PDF 时只有 9KB。在新文档中进一步优化图像会使图像质量进一步下降。对于 jpg 等位图图像格式来说,这是不可避免的。

上面的尺寸使用情况表明 Acrobat 显然以最高的质量导出了图像。这是有道理的,因为当您这样做时,您希望以最少的图像数据损失导出它们。

一个选项可能是对文件进行 OCR,将图像转换为文本,文本文件比图像膨胀要轻得多。Acro Pro 包含 OCR 工具,但我无法测试它,因为我没有阿拉伯语。

编辑:扩展语言包仅适用于 Adob​​e Reader。经过一番研究,似乎 Acrobat 不支持阿拉伯语 OCR。请参阅此Adobe 论坛讨论

扫描成 PDF 然后进行优化总是需要在大小和质量之间进行权衡。您只需使用不同的设置(原始扫描和优化)进行测试,即可找到令人满意的折衷方案。

PDF 优化说明位于 Acrobat 帮助中。杂技演员杂技演员 XI

相关内容