我太抠门了,不愿意雇人重新输入一份很长、充满法律术语的扫描文档。所以我用 OmniPage 对其进行了 OCR 处理。但 OCR 输出结果有点令人失望。我得到的 Word 文档有多个行距。前后段落的高度完全不同。
如果整个文档的段落设置都相同,那么这将很容易,但事实并非如此。可能有六种不同的样式。
规范化文档的最简单方法是什么?例如,如果一个段落的行距为 20.4 pt,另一个段落的行距为 20.9 pt,那么我想将它们视为相同的样式并将它们设置为单个值?或者真的,此时欢迎任何建议。
答案1
我最终得到了一大堆混乱且无法维护的文件,我需要清理它们。
如果您尚未使用段落/字符样式,那么您将需要学习和使用它们。
在功能区的“主页”选项卡中,查找“样式”窗口。
在 Word 中选择一个或多个段落,然后选择其中一种段落样式,将把该样式的格式应用于您选择的所有段落。
如果您将来想要更改样式,这也使得更改变得更容易 - 只需进入给定样式的样式定义,进行一些更改,然后您的更改将反映在使用该样式的所有段落中。
单击功能区中样式窗口右下角的小箭头可以查看样式列表。
我的文档清理过程
- 重新开始(放弃所有当前格式并应用默认段落样式)- 选择所有文本,然后选择与大部分文本相匹配的段落样式。所选文本通常是常规段落,因此我选择“正文”段落样式。现在所有文本的样式都应一致。
- 逐步重建文档样式 - 应用标题 现在我按顺序浏览文档并添加标题(扫描整个文档以查找标题 1,然后是标题 2,等等)
- 应用其他段落样式- 我继续对所有其他需要应用段落样式的项目(列表、附加段落、标题、表格、图像)执行上述步骤
- 应用字符样式- 然后我扫描任何需要应用的字符样式。
- 微调样式- 此时文档基本已经完成。我会调整给定文档中需要修改的任何样式。
有用的 Word 快捷键
CTRL+SPACEBAR Strip character formatting that's not contained in the applied paragraph style.
CTRL+Q Strip paragraph formatting that's not contained in the applied paragraph style.
CTRL+SHIFT+N Apply Normal paragraph style.
答案2
我发现,有时 Word 无论如何都不喜欢修复这种情况。如果是这种情况,请将整个文档复制到记事本中,尝试保留批量格式(如空格和段落),然后使用新设置复制回 Word。
答案3
如果您选择整个文档的文本,然后打开段落格式窗口(如上所示),我认为值将为空白,因为有多个值。但是,如果您手动输入所需的值,则所有值都将更改为新值。