FineReader OCR 输出到 Word 时,经常会在转述语中的首字母“ ”后面添加一个虚假空格,我希望将其删除。但是,使用“查找和替换:查找“ *” 不会区分首字母“ ”后面的空格和最后一个字母“ ”后面的空格,因此它还会选择一个引号的最后一个“ ”和下一个引号的首字母“ ”之间的字符串。
替代的解决方案是 VBA(我必须学习)或 Perl 程序(需要大量修改),但我不想走这些路线,因为在我的年龄,它们所需的智力努力可能无法持续 :)
答案1
对于普通标点符号,一个简单的解决方案是查找[ " ]
并替换为[ "]
(我使用方括号以便于阅读:它们是不是部分搜索或替换字符串,在此处或下方),但当引号位于行首或引用文本中有尾随空格时,此方法不起作用。
我已经找到了一个更通用的解决方案,但它不能通过一次替换来完成:-
- 首先找到匹配的引号对
["*"]
。 - 然后用文档中未使用的字符标记它们;我已经使用它
#
来进行说明,但您可以使用任何其他字符甚至字符序列。 - 将替换文本设置为
[#^&#]
并全部替换(^&
替代原始匹配字符串)。 [#" ]
现在,您可以通过替换来删除前导空格["]
。- 最后,将]
#
替换为,删除剩余的字符。[#
[]
如果有任何不匹配的报价,这就会变得混乱。
我没有最新版本的 Office,但它肯定可以在旧版本上运行,并且我不知道后续版本中查找/替换的功能有何重大变化。