我想扫描旧文本文档,然后销毁一些原件。
除了抽查,我还能做什么来获得可接受的低扫描失败率?我希望失败率低于 0.25%(抽查后)。我把遗漏或无法辨认的页面算作失败。
这似乎是一个难以实现的目标。首先,我能做些什么来降低失败率,以便减少检查工作量?
相关问题(该问题是关于“QA”,即防止故障,链接的问题是关于“QC”,即检测故障):使用进纸器时如何验证扫描的页数和质量?
答案1
为了降低使用非常多样化的文档的错误率(正如你在对于旧个人文档而言,扫描仪 + 送纸器中的哪些功能很重要):
(A) “简单”的答案:1. 将文档按文档特征分成几批。2. 对于每批文档,使用不同的扫描仪驱动程序设置进行测试扫描。这样做直到您找到一组驱动程序设置,该设置可使测试样本中的扫描失败率“低于 0.25%”。3. 使用这些驱动程序设置扫描其余的文档。4. 进行抽查以验证您的扫描结果是否在预期的失败率范围内。5. 如果失败率较高:请返回步骤 2 并使用新的测试样本微调驱动程序设置,或者返回步骤 1 并将您的文档分成单独的文档,每个文档都有自己的扫描仪驱动程序设置。
(B) 使用 (A),您应该能够使用非常简单的文档达到预期的失败率,即在白色、无折叠、无皱褶的标准质量纸张上进行纯黑色单面打印。如果您有许多这样的文档,您的批次大小可能会非常大。但文档的属性越多(例如彩色纸张、彩色打印、丝网印刷图像/图形、薄纸渗透、低对比度、发黄、销售单据褪色、纸张破损……),在 500 英镑的预算下,扫描所花费的时间就越多。您需要将文档属性的变化保持在尽可能低的水平以达到您的失败率。因此,您的批次大小将会减小。根据您的文档,您可能最终需要检查或多或少其他所有文档以保持在您的失败率之内。如果您想要使用 OCR 来更轻松地检索文档,并且您拥有不同语言的文档,这会增加额外的复杂性。
(C) 购买一款声称能够处理您放入扫描仪的任何内容的专业软件——无需事先对文档进行分类。但是 1. 仅使用这种软件会超出您的预算,2. 这种软件只能与经过认证的扫描仪配合使用,这会耗尽您的全部预算,而且您仍然“渴望”购买其他软件。
答案2
您可能有机会以更少的时间和精力(如我上面的回答中所述)达到低于 0.25% 的失败率,并且在 500 英镑的预算之内,如下所述:
有些公司出租专业扫描仪,有时还附带一台装有其他专业扫描和/或后期处理软件的计算机。要求这样的公司提供设备(扫描仪和软件),包括使用介绍和待命支持,可用一两天,在您的预算范围内,可以最大限度地实现图像处理的自动化,而无需事先将具有相似特征的文档分类成批。
如果幸运的话,您可能会在预算范围内买到可以一次性扫描大部分文档的设备,并在特殊情况下进行多次重复扫描 - 前提是您能够操作此类设备和/或随时待命快速帮助。
这种方法的好处是:您将看到扫描仪和软件在特定价格水平上可以实现的功能,当您以后购买自己的文档扫描仪时,您将能够更好地调整您的期望,经过这次体验,您可能会将预算上调至 500 英镑以上。