我正在尝试将一包信息扫描到一系列 Word 文档中。前几页是索引的一部分。它的布局如下:
第八条 13 第 1 节...协会通知 13 第 2 部分...未付评估费通知 13 第三节...其他通知的通知 13 第九条 14 第 1 节...利益冲突 14 第 2 部分...等等 15
当我在 MODI 中打开扫描的 .TIF 并将其复制/粘贴到 Word 中时,它看起来像这样:
第一条 部分 部分 部分 部分 部分;离子 部分 部分 部分 部分 部分 部分 部分 第二条 第 1 节。 第 2 节。 第 3 节。 第 4 节。
基本上,它似乎将空格和连续句点转换为回车符。如果它至少可以使用制表符或空格来保持文本部分的位置,那么这至少会很棒。
答案1
据我所知,MS Document Imaging 无法捕获文档的布局,但这些产品可以:
- 免版税OCR- 免费、好用的工具。
- 新OCR- 网上免费。
- ABBYY FineReader- 非常棒的软件,但价格不便宜。不过有试用版。
答案2
我知道这听起来有点奇怪,但如果您有 Adobe Acrobat 的副本,您可以将其扫描为 PDF,然后将 PDF 保存为 Word 文档。我发现这是一种将扫描文档转换为 Word 的有效方法。