如果我想扫描一份文档,10 页,每页为 PDF 300dpi,灰度。10 页 6MB..40 页 24MB。精细。彩色,每页 25MB 为什么彩色是 25MB?
PDF 效率很低吗?它只处理文本和图像。
但更大的问题是,
更疯狂的是……我将 10 页扫描成一个文档。它占用了我的 TEMP 文件夹中的 1GB。1GB!!!!它处理完后,1GB 就被释放了。
但是为什么在处理一个 6MB 的文档时会占用 1GB 的空间呢?
我认为它在这里 C:\Documents and Settings\user\Local Settings\Temp\MaglevExpressTemp
软件是 HP Solution Center。
其他软件是否占用那么多空间?有些软件比其他软件更糟糕?对于我的 HP 扫描仪,我是否不应该使用 HP 解决方案中心?
答案1
PDF效率很低吗?
不是特别,正如您对 Q 的评论所示:
因为 10 张灰度图片的 PDF 有 6.35MB!
这一切都取决于分辨率和压缩级别。
根本的答案是:整页都非常大,而且典型的扫描和打印分辨率都相当高:因此会产生大量的数据。
基本计算:
A4 约为 8.3x11.7 英寸(信纸类似,差异不大)。因此一页为97in2。
在 300dpi 下,1in2为90,000 像素。以每像素 24 位 (足以显示 1600 万种颜色) 计算,约为 260kB。
因此 100in 2需要大约 26MB。这与您的数字相符。注意:每像素 8 位(256 级)的灰度大约需要其中的三分之一。
1GB 的中间文件
但是如果您想要 300 dpi 的最终输出,那么您确实需要在最终输出阶段使用更高的分辨率(以避免出现伪影:只需尝试打开并重新保存具有中等压缩的 JPEG 几次,看看这些伪影如何快速出现)。
我的旧扫描仪(>8年了?)的运行分辨率为 2400dpi(IIRC),因此 600dpi 左右的分辨率对于大多数扫描仪来说都属于容易接受的范围内,因为这是线性测量,所以单位面积(以及文件大小)将随着平方而增加,导致文件大小增加四倍。
即每张图片约 100MB,所以预计 10 张图片占用 1GB。
但最终的产出要小得多
这几乎肯定是压缩的。非松散压缩的图像具有大面积的恒定颜色,通常可以压缩 10 倍,而不会明显丢失感知信息,对于扫描和照片(它们往往具有大量我们只能在极端缩放级别才能看到的微小变化),一些损失是正常的(如 JPEG 所用),并且可以实现类似的压缩比。
它有多大?
专业数码单反相机每色使用 14 位(高端扫描仪也应该可以),即每像素 42 位。以 4800dpi 扫描 A4 纸张会导致单页原始数据大小约为 11GB。
答案2
如果将文件扫描为 .tiff 图像,则会创建非常大的图像。您应该可以选择扫描为 .png。我还更喜欢使用 XP 扫描仪和相机向导,而不是任何扫描仪包(Vista/7 有扫描仪和传真机)。
答案3
我注意到专业扫描占用的空间大约是我的十分之一,尽管它们的质量要好一些。他们显然使用与我的不同/更好的扫描仪。(都是 pdf,所以我们在谈论同类产品)我的意思是他们可以给我发送一份合理大小的 10 页彩色文档。我用我的扫描仪永远无法做到这一点。