以 TIFF 格式扫描旧文件。以 48 位颜色扫描值得吗?

以 TIFF 格式扫描旧文件。以 48 位颜色扫描值得吗?

我目前正在使用扫描一些带有注释的旧文件爱普生 V370扫描仪。我希望输出文件为 TIFF,但是我不确定要选择哪种位深度。

其中一张纸上只有几张用黑色墨水写的纸条,没有其他颜色。我想从扫描仪中获取最高质量的图像,但是用黑色墨水以如此高的颜色深度(例如我的扫描仪上的最大颜色深度为 48 位)扫描白纸是否有意义?

另外,如果我的纸张含有蓝色墨水,更高的颜色深度会对质量产生影响吗?

答案1

为了回答您需要多少位色彩深度以及它如何影响您的结果,让我首先快速解释一下色彩深度实际上是什么。

什么是色彩深度?

色彩深度描述将存储多少种色调。 如果图像具有非常精细的颜色层次,扫描和存储极高数量的颜色意味着这些细微的区别将在存储的图像中以不同的方式编码,并且可以在进行图像处理时进行区分。存储较少数量的位数意味着其中一些层次将存储为相同的颜色,因此它们不会被区分。

您可能已经看到过这种效果,尝试将包含精细渐变的照片存储为较低位格式(如 8 位 GIF),这种格式仅存储 256 种独特的颜色。您看到的不是连续的渐变,而是条带,因为必须将多种色调压缩为更少的可用颜色,从而产生颜色“阶梯”,如下面的比较所示。

在此处输入图片描述

在此处输入图片描述

需要多少位?

人眼可以区分每种原色超过 256 种色调,但这足以呈现照片级品质的图像。这需要每种原色 8 位,即 24 位。合起来就是超过 1600 万种颜色。以 48 位,即每种原色 16 位计算,可以区分每种原色超过 65,000 种色调。这远远超出了人眼的分辨能力。

48 位颜色

那么为什么要使用 48 位色彩呢?因为它对摄影工作很有用。最亮区域的细节可能会被冲淡,而最暗区域的细节则难以分辨。通过图像处理,可以拉伸这些范围以在相似颜色之间留出更多距离,从而更好地区分这些细节。然而,这会在色谱中留下空白。从 48 位开始可以提供那些否则会缺失的中间颜色。

当你拉伸一个颜色范围时,其他颜色会被压缩,从而合并一些颜色。其他类型的图像处理也会导致一些颜色值的类似损失。当你从 24 位开始时,通过连续处理步骤累积的损失可能会产生明显的退化。从 48 位开始,即使大量颜色损失仍会留下远远超过所需的颜色。

通常需要将结果降采样至 24 位才能正常显示或打印。因此,即使对于摄影作品,48 位也是专用的。

色彩深度与扫描色彩的能力

扫描仪具有特定的光学特性,每次扫描都以硬件产生的色彩深度进行捕获。该信息由软件处理以产生具有指定色彩深度的图像。因此,如果您的扫描仪能够处理 48 位色彩,那么它就会被捕获。如果您只想要 24 位色彩,那么一些色彩会被合并。

但是,无论颜色深度如何,页面上的每种颜色都会被存储为某种颜色。不同之处在于,颜色深度越高,您就越能区分它们。因此,例如,颜色深度越高,您就越不能更好地捕捉蓝色。

扫描文本

如果您谈论的是文本,那么使用 48 位绝对没有任何好处。它只会给您带来处理速度很慢的巨量文件。但一定程度的颜色深度有助于清理扫描。

使用颜色信息进行清理

以传真为例。它使​​用 1 位,即黑色或白色。因此,页面上的每种颜色都必须用其中一种颜色来表示。这是通过选择阈值暗度来实现的。任何较浅的颜色都会变成白色;任何较深的颜色都会变成黑色(基本上,将 48 位颜色转换为 24 位颜色的过程也是一样的)。对于传真,结果通常是一团糟——块状字母、污迹会变成颗粒状黑色斑点、纸张上的折痕会变成黑线。

这是因为扫描仪看到的东西。纸张不是纯白色的(而且可能会不均匀地变黄)。如果有任何折痕或皱纹,您可以看到它们,因为它们会产生阴影。页面上的字母不是纯黑色,通常包含较亮的区域。灰尘或污迹有暗色和彩色。通常,伪影的最暗部分比内容的最亮部分更暗。这使尝试生成干净的扫描页面变得复杂。

掌握一些颜色信息后,您可以使用图像处理工具来清理扫描件;区分伪影和内容。去除伪影后,可以通过降低颜色深度使扫描件更易读。强制文本变暗,背景变白,可以更接近地模仿原始文档刚打印在白纸上时的样子。

结论

色彩深度不会提高您捕捉色彩的能力,例如蓝色,蓝色的扫描效果不如其他颜色。但是,它可以让您改善结果。如果原件不完美,则以 24 位色彩进行扫描是一个很好的起点。即使它最初是白纸上的黑色墨水,颜色信息也会让您更容易去除通常有颜色的伪影。

移除伪影后,颜色信息可用于改善内容的外观。扫描效果不佳的蓝色墨水可以变暗,而不会影响扫描效果良好的颜色。浮雕公证印章等可能几乎看不见的东西可以变暗。灰白色的纸张可以变白。内容和背景之间的对比度可以得到改善。

完成所有这些操作后,可以使用更小的颜色范围来表示页面。因此,24 位颜色可以减少为 8 位颜色(或更少),或灰度。这样可以将最终结果存储在更小的文件中,同时看起来比原始文件更好。

低色彩深度技巧

如果您正在处理文本,并希望最终结果看起来像白纸上的干净黑色文本,则可以使用低色深来解决问题。首先,您需要使用比结果所需的分辨率高得多的分辨率,例如 800 到 1200 dpi 和 24 位颜色。使用颜色信息去除伪影、提高对比度等,直到获得尽可能好的效果。然后将图像转换为 1 位颜色(黑白)。

这将强制将清洁后的图像变为白底黑字,而高分辨率将捕捉内容中的精细细节。然后向下采样到所需的分辨率(通常为 200 到 300 dpi)。向下采样将文件转换为灰度或 24 位颜色。如果这不是自动的,请选择灰度作为输出。

这将产生与 ClearType(子像素渲染)类似的效果。在高对比度和正常分辨率下扫描时会完全丢失的细节将以几位灰度保留。文件可以保存为 4 位灰度,这将是一个非常小的文件,但结果质量很高。

答案2

我想从该扫描仪中获取最高质量的图像,但是用黑色墨水以如此高的色彩深度(例如我的扫描仪的最大颜色深度为 48 位)扫描白纸是否有意义?

关于色彩深度、DPI 和文档扫描的简短回答:

简而言之?绝对没有理由用如此高的色深扫描带有黑色墨水的白纸。48 位色深主要用于高分辨率照片或彩色文档,而不是文本。许多扫描仪提供 48 位色深的原因仅仅是因为如今它们可以做到这一点。但除非您正在处理或输出需要每通道 16 位颜色数据的图像,否则它充其量只是过度使用。24 位色深对于正常使用来说已经足够了,事实上,我很有信心您正在以 24 位色深运行的显示器上阅读此文本;每个 RGB 通道 8 位 = 24 位。

关于扫描文档的详细答案:

就文档扫描而言,色彩深度正是:深度颜色。DPI(每英寸点数)是另一个指标,这是你应该注意的。

我手动扫描了大量文档,处理这个问题的方式是将这个过程视为一个多步骤的过程。这是我对没有彩色图像的黑白文档使用的基本步骤:

  1. 初始扫描:我认为文档的初始扫描只是第一次原始扫描,目的是将图像转换为数字格式。我通常以 200-300 DPI 的 DPI 和标准 RGB 位深度(我认为是 24 位)进行扫描。而不是 48 位颜色深度,这对于扫描简单的双色文档来说确实有点过头了。
  2. 扫描处理: 扫描页面后,我会在 Photoshop 中处理它们,或者像素化。我这样做的目的是调整图像的对比度,使白色区域真正是白色,黑色文本/线条真正是黑色而不是灰色。
  3. 转换为灰度:您几乎可以在整个扫描处理阶段执行此操作,但我仍然认为这是一个单独的阶段。在 Pixelmator 中,您可以将 RGB 转换为灰度,这将使最终文件大小降低十倍。因此,40MB 的 RGB 扫描现在降到 4MB,几乎没有明显的质量损失。
  4. 保存图像:您在问题中选择的是 TIFF,但在从事此类制作工作多年后,我可以证明,将扫描的 TIFF 图像以 100% 质量保存为 JPEG 可以保持类似的整体质量,并且任何“数据丢失”都可能技术上是“真实的”,但在视觉上却无法察觉。

现在,如果您的页面包含图像,则扫描处理任务(列表中的第 2 项)可能需要更多工作。在不错的照片编辑程序中,您可以(基本上通过绘制框)仅选择要调整的文本,然后根据需要单独调整嵌入的图像。

从我的工作流程角度来看,如果我有一份 20 页的文档,其中 3 页有需要这样调整的图像,我会先打孔其他 17 页黑白页面,然后将更复杂的内容留到最后。

答案3

另一方面,在某些情况下,较高位的扫描本身可能会有用;例如,当扫描材料的​​可用对比度或范围非常小时。

根据我的经验,普通的消费级扫描仪在硬件上没有任何真正的调整功能,无法调整颜色、对比度、灵敏度或光线。所有调整都是在软件中利用从扫描中获取的原始数据(不包括 DPI)完成的。

如果文档或图片确实存在细微的差别,并且需要进行重大校正,那么从更多位(甚至是您在显示器上看不到的位)开始意味着您可以对收集的数据进行大量的范围“扩展”。

如果您的图片太暗,如果页面上的文本太淡,如果您事后必须在软件中使用大量色阶、对比度或亮度,那么一开始就拥有更多变化会很方便。这甚至可以包括扫描黑白文档的彩色图像。

虽然我同意其他答案中的说法,但是当我处理非常糟糕的材料时,知道我的扫描仪(至少是我的)在“库存”、“一刀切”扫描和照明之后高度依赖于软件,我会将其转移到更高的比特率(16 或 48)进行初始扫描,然后将其更直接地输入照片程序中进行处理,而无需进行调整,而不是使用扫描仪软件,在照片程序中的所有处理完成后,以正常位深度完成(保存)。

如果你真的渴望从无到有,并且必须做很多调整才能实现,那么就不用担心有更多可能的级别可以使用。对于至少利用 50% 数据范围的普通项目来说,这是没有必要的。

最后一点:即使我尽了最大努力,手动调整,拥有巨大的位深度,它也无法把猪耳朵变成丝绸钱包。

答案4

随着您降低位质量,您将开始引入伪影,因为系统必须近似颜色值。这在非常低的位深度(例如 2 位或 4 位扫描)下会变得明显。例如,2 位扫描意味着每个像素都必须是纯黑色或纯白色。纸张上的大折痕可能会在图像上呈现为一条黑线,甚至纸张中的纤维也可能导致出现黑色斑点,而这些斑点在随意检查时是看不到的。

事实上,那是一种用于支票纸上的防复印装置,其形式是几乎看不出来的条纹,上面写着 VOID,由于混叠,在低质量扫描件(如原始 Xerox 机器)上会显示为一组纯黑色字母。这里的寓意是,您要远离非常低的设置以避免混叠。

另一方面,48 位文本再现可能有点过头了。在某个时候,增加采样量并不能带来相同的成本效益。例如,从 24 位跳到 48 位,在随意观察时可能难以区分,但文件大小会减少一半,并且每页的扫描时间会大大减少。我建议从 16 位或 24 位开始,只有当您对中等质量的扫描不满意时才增加采样量。

相关内容