答案1
PDF 文件质量低下的原因在于您缺乏对矢量图像和位图图像之间的差异以及 PDF 文件格式内部结构的理解。这导致生产过程不合适,无法产生预期的结果。
位图字体与矢量字体
计算机历史始于位图世界。字符由位图(也称为“光栅图”)表示。请参阅以下 Atari 位图字体:
https://fontmeme.com/fonts/atari-font/
计算能力和存储方面的技术进步使得可以通过所谓的矢量字体以更美观的方式表示字符,例如将字母“d”粗略地描述为一条直线切开的圆圈。
矢量字体可以放大到宇宙大小而不会损失质量。位图字体,无论它们消耗多少资源,都可以缩放到您能看到方形像素的级别。
Adobe PDF 文件格式内部结构
PDF 文件格式允许混合不同类型的对象,例如使用不同类型压缩的位图图像以及矢量字体。
有损压缩方案不适用于文本
JPEG 或 JPEG2000 等压缩方案(其算法在 PDF 文件格式中实现)不适用于文本,因为它们典型的有损应用模式会产生容易看到的压缩伪影。
不合适的 PDF 制作流程 - 打印到虚拟 PDF 打印机
最有可能的是,您的源在打印时被解压缩,为打印机提供一个巨大的位图,打印机使用适合图像但不适合文本的压缩方案以有损方式重新压缩该位图。
您可能不会在扫描的图片中看到这种质量损失,但在查看文本时您会看到它。
解决方案 1
或者尝试 Daniel B. 的提示,提高扫描质量,以高分辨率打印,并确保打印机设置不会过度压缩该图像。
解决方案 2
另一种方法是使用 PDF 编辑器,将图像作为有损 JPEG 格式,将文本作为 PNG 文件。这样,您的编辑器就可以在 PDF 文件中分别保存这两个元素(文本和图片),而不是像 PDF 打印机那样使用单个位图。
然后,您的 PDF 文件将由两个引擎解码:DCDDecode 用于图像,JBIG2Decode 用于文本,请参阅文章中的“光栅图像”部分 https://en.wikipedia.org/wiki/PDF
解决方案 3
如果这不能满足您的期望,您需要以您可用的最高光学分辨率单独扫描文本。然后您需要进行 OCR 并让某个程序猜测原始字体类型。如有必要,您需要手动更正字体类型。
记住扫描的制作过程:有一个高质量的位图图像和出版商使用的矢量字体。在打印过程中,文本会使用矢量信息转换为高质量的位图。我猜可以达到 2540 dpi。
您的相对较差的扫描设备可能只能提供 600 dpi 的光学数字,这已经反映了 x 轴和 y 轴上大约 50% 的损失。
我希望这可以解决你的问题!
答案2
您可以在选择图像查看器时看到类似情况。基于其当前模式。相同的图像 2 种模式,左侧是查看器,右侧是编辑器,大多数 PDF“阅读器”都是编辑器。
IrfanView 有多种 PDF 和/或图像设置。在这里,PDF 图像看起来就像是完美扫描的(无损或有损并不重要)。在 PDF 查看器中查看,在 IrfanView 中打开的相同 PDF 将降级为更大的像素(首先将进行抗锯齿处理,然后使用别名进行 PDF 查看)。
作为图像来看,它将被平滑。
PDF 必须在网格中以某种形式定义每个像素形状。它可能是一个倾斜的网格,并且有奇怪的示例。但请考虑大多数 99% 以上的像素将是规则的矩形。以下是 Google PDF(图像)显示中 3 像素宽 x 3 像素高的图像。
您应该看到放大或缩小后的效果完全相同。因为 PDF 必须能够显示 QRCode 和其他基于像素的对象,而无需任何增强平滑处理。图像查看器具有不同的范例,因为它们需要插入和柔化图像。除非作为图像,否则您看不到的是,有 2 个黑角像素,它们之间只有一个白色方块。
Acrobat 没有总是保持颜色纯度,这样颜色可以改变,但形状不能改变(除非被告知)。我们确实看到了来自同一 PDF 的图像,其中 RGB 颜色配置文件有两个黑角!
一个优点是单个像素可以旋转和不成比例地拉伸(这些与上面的方形单个像素相同)。图表没有任何分辨率,只是矢量。保存为 3x3 的图像,我将它们放置在 5x5 的白色背景上。因此我们可以看到 2 个正方形是黑色的。然后文件将被错误地保存为 96 DPI,因为在 pdf 中它具有不同的低得多的 3 PPI。
图像查看器将通过前瞻规则对像素进行平均,因此可以看到渐变来软化粗糙的边缘。发现左下角显示正确,颜色更黑。
在不同的产品中更加明显的是,在同一个查看器中呈现完全相同的图像,
左侧为图像,右侧为 PDF。