我将几个不同 PDF 中的选定部分粘贴到 MS Word 中,在某些情况下,整个句子会粘贴在一起成为一个单词,中间没有空格(例如:whatImeanistextlikethis)。手动在每个单词之间插入空格非常累人。是否有任何内置方法或插件可以自动执行此类操作?MS Word 显然从其词典中知道单词应该是什么,所以我希望有一个插件或宏可以利用这一点进行智能拆分。
更新:我现在已经尝试了Ctrl+ V、仅粘贴文本、选择性粘贴(无格式文本)和选择性粘贴(无格式 Unicode 文本),没有任何区别。粘贴到普通的旧记事本中也会粘贴成团的单词。
更新2:以下是一些相关链接,供其他想要自动分词的人参考:
答案1
注意:这个问题问了两年了,但我在写这篇文章的时候也遇到过这个问题
此解决方案需要 Google Chrome(和内置 PDF 插件)
在 Google Chrome 中打开 PDF(例如,将文件拖放到 Google Chrome 中)
突出显示要复制的文本
复制文本(例如通过上下文菜单)
将剪贴板内容粘贴到文本编辑器中(在本例中为 Microsoft Word)
将所有括号(或单词之间的任何字符)替换为空格
从 PDF 复制的文本:what)I)mean)is)text)like)this
带括号的文本被空格替换:what I mean is text like this
请注意,如果原文(即 PDF 中的)有括号,则需要特别注意
答案2
我知道您在寻找什么,但老实说,根据您想要的操作的复杂性,我对这样的脚本/插件/宏感到怀疑……幸运的是,我相信有一个更简单的解决方案。我不是这方面的专家,但我确信 Word 错误地解释了文本的格式。我会先将其粘贴到记事本中,看看那里的间距是否正确,然后将其粘贴到 Word 中。