对于旧的个人文档来说,扫描仪+送纸器中的哪些功能很重要

对于旧的个人文档来说,扫描仪+送纸器中的哪些功能很重要

我想扫描一些旧文本文档。目的有两个:灾难恢复(例如火灾)以及节省我很少参考的大型文档(例如旧电话账单)的空间。

扫描后,我打算销毁一些原件,因为我很少参考它们,而且它们体积庞大。其余的我会保留下来并继续参考。我不打算对文件进行 OCR。

我估计要扫描几千张 A4 纸,我的目标是每扫描 1000 张纸只有几张失败(漏掉或难以辨认)。难以辨认的意思是人类无法可靠阅读的文本。

我希望自己做这件事而不是使用商业服务。

我相信这些文件是家庭用户在过去 10 年或 20 年里在文件柜中收集的典型文件:

  • 大部分(可能 80%)为标准纸张尺寸或接近标准尺寸(A4,在其他地方大概为美国信纸)
  • 一些比 A4 更长的钞票(不到 10%)
  • 少量“非常杂乱”的页面(不到 10%)
  • 大多是相对平整的优质纸张
  • 这些文件打印在各种纸张上,包括账单、收据、信件等。
  • 许多(但并非所有)文件都是双面打印的
  • 彩色和黑白混合。大多数文件没有以重要方式使用颜色
  • 少数页面包含一些图形和图片等(可能为 5% 或 10%)
  • 少数泛黄的书页(不足5%)

我想扫描彩色,因为我不想确认所有颜色信息都不重要。我会排除大幅面文档(例如 A3),但理想情况下我想扫描长度超过 A4 的账单。

我不介意逐张扫描“棘手的案例”,但希望尽可能使用送纸器来节省时间。不过,我预计高端专业扫描仪并不是真正需要的。此外,只要文档仍然清晰可读,纸张损坏就不是很重要。

除了 dpi 之外,扫描仪和送纸器中的哪些功能对于此类工作很重要?我所说的“功能”是指设计的具体技术特性(或性能特征),而不是“可靠性”等宽泛的类别。

我不是在寻求产品推荐。我想知道哪些功能与这种规模的应用程序相关。

答案1

如果您的纸张(或其中部分纸张)有折叠或起皱(例如纸张在接触水或高湿度后变干),最好选择 CCD 扫描仪而不是 CIS 扫描仪。CCD 元件的景深比 CIS 大得多。使用 CIS 扫描仪扫描此类纸张会导致扫描结果出现不清晰的区域。OCR 通常会在不清晰的区域失败。您可以使用驱动程序或软件中的设置来锐化此类区域,但这仍然可能无法获得可靠的 OCR。使用 CCD 扫描仪,您可以从一开始就避免此问题。

关于长度超过 A4 的页面:可能您价位的所有单页进纸扫描仪都支持此功能。这通常是扫描仪驱动程序中的一项设置,用于关闭按长度进行多页进纸检测。

通过标称速度(每分钟页数/图像数)来比较扫描仪可能会产生误导。有些制造商标称扫描速度为 150 dpi,而其他制造商则标称扫描速度为 200 或 300 dpi。速度在很大程度上取决于您选择的扫描仪驱动程序设置。例如:如果您以 300 dpi 的分辨率扫描带有(丝网印刷的)图片/图形的报纸/杂志文章,并且希望扫描较小的文档,则需要在驱动程序中选择去网屏功能。这将导致您的扫描仪速度明显变慢。尽管您为此类扫描设置了 300 dpi,但速度将与大约 600 dpi 的扫描速度相当(请记住,我们讨论的是价格仅为 500 英镑的相当便宜的文档扫描仪)。

选择使用 LED 作为光源的扫描仪,而不是使用冷阴极放电灯(一种较旧的照明方式)。LED 的使用寿命更长,不需要预热时间。

答案2

对于任何如此重要的工作,我认为产品/公司的可靠性非常重要。(如果扫描质量低或进纸器损坏,规格就无关紧要了。)此外,我假设(当然,我可能错了)当今所有扫描仪都具有足够高的 dpi,并且能够输出常见的文件类型(jpeg 用于较小的文件大小,png 用于较高质量的文件,等等)。

然而,我建议花点时间考虑一下数字保存是否足够可靠。例如

  • 我们能确定 DVD、HDD 或闪存驱动器可以保存其内存很多年吗(假设您希望保存很多年)。
  • 我们确定十年后我们能够读取这些文件吗?(想想文件类型和硬件类型。——你今天如何从软盘读取信息?!)

数字保存在维基百科上。并且在此网站上回答。

答案3

假设您打算继续定期扫描收到的文档(如果您只打算扫描旧文档,那么最好还是通过扫描服务来完成):

扫描配置文件(某些扫描仪生产商称之为扫描预设)将使您的工作更加轻松快捷。使用配置文件/预设,您可以保存扫描仪驱动程序设置组合以供日后重复使用。例如:配置文件 A 用于在标准白纸上进行纯黑色打印,配置文件 B 用于彩色杂志文章,配置文件 C 用于不同尺寸的销售单据(例如,自动裁剪为原始尺寸,而不是以标准页面尺寸扫描小单据),配置文件 D 用于双面打印的薄纸(驱动程序设置,例如,透视或防渗透),配置文件 E 用于超长文档等。

考虑到您提到的文档,您可能会需要超过 9 个扫描配置文件。许多 ADF 扫描仪只提供 9 个配置文件,有些甚至更少。一些制造商在驱动程序中实现扫描配置文件,其他制造商在“扫描实用程序”软件中实现。有些提供硬件按钮来选择配置文件。许多带有硬件按钮和显示屏的型号只显示配置文件编号,没有附加文本。您以后会记得配置文件 3 的作用吗?一些扫描仪有一个显示文本的显示屏,因此您可以为配置文件命名。还有超过 9 个配置文件?通常在软件中实现 - 但这样的要求会让您很快超越消费级硬件/软件。

我建议购买驱动程序已支持自动裁剪的扫描仪。如果您必须使用其他软件裁剪扫描件,则必须做出很多妥协。所以最好不要指望以后使用其他软件升级此功能。可靠的自动裁剪很难仅在软件级别实现(并且需要相当多的 CPU 能力)。即使消费级第三方软件声称支持自动裁剪,您也会得到很多错误的结果(从裁剪不足到裁剪过多,甚至完全随机裁剪 - 在我的测试中,有售价约 200 美元的消费级和半专业软件完全随机裁剪)。

为什么我没有将答案限定在硬件上?因为购买扫描仪并不像那些以前没有使用过文档扫描仪的人所想的那样,与购买打印机不同。打印对话框或多或少是标准化的,在我们用于一般打印需求的众多打印机生产商和型号之间,差异非常有限。扫描仪的 WIA 驱动程序(Windows)同样是标准化的,但您只能获得扫描仪功能的一小部分。TWAIN 驱动程序则完全不同。如果您之前没有使用过扫描仪驱动程序和图像处理,那么理解和充分利用扫描仪驱动程序和扫描实用程序软件所需的时间会因扫描仪生产商甚至生产商的型号而有很大差异。即使您了解了一个型号,您也可能会对另一个型号感到困惑,甚至想将其扔出窗外。

购买扫描仪后,您就只能使用其驱动程序和扫描实用程序软件了——假设您不准备超出预算购买其他第三方软件,或者您不愿意或无法使用脚本修补工作流程或使用许多免费或开源软件手动完成处理步骤。如果您愿意额外花钱购买额外的图像处理功能、更多扫描配置文件、更多自动化功能(文件命名、将文件分发到特定文件夹等),那么您很快就会花费不菲,因为您进入了一个以大型公司为重点的市场,而这个市场正缓慢地向 IT 资源有限的小型公司转变。您的扫描需求与许多小型公司或 SOHO 的需求重叠。

相关内容