纠正 Word 中不适当的段落分隔符?

纠正 Word 中不适当的段落分隔符?

我最近将 PDF 转换为 Microsoft Word,在更改转换文件的边距和纸张大小后遇到问题。对话框中间有一个段落标记。以下是示例:

“菲尔莫尔临终时非常饥饿。但他的医生试图让他挨饿以缓解发烧或其他症状。
然而菲尔莫尔却不停地说他想吃东西,所以最后医生给了他一小茶匙汤。
菲尔莫尔讽刺地说,‘营养很好’,然后就死了。没有休战。”

这段对话本该是同一段,转换后的文章中却有很多相同的问题。我该如何修复?(我希望可以一​​次性修复,这样可以节省时间。)

答案1

据我了解,上述问题与 OCR 处理有关,OCR 只是转换其理解的内容并创建文档,很多时候会错误地翻译与可能被误解的字符相关的内容。因此,无论如何,这还不是一门精确的科学,因为 OCR 程序已经发展得非常好,但对其解释仍然不是 100% 肯定。我们总是需要手动修复这些错误。

答案2

我认为 PDF 文档的段落结构与任何文字处理程序中的段落结构都不一样。它只是文本在工作表中的位置,字符要么表示为打印图像,要么表示为关联字符,但我不认为它包含颜色、段落和下一行或 Enter 代码等格式信息。

相关内容