我将 PDF 表格转换为 Word,以便将其转换为 Excel。但每个单元格中的文本被分成了几个单元格。我知道如何合并单元格,但每次只能合并一个单元格——我的文档有 150 页,有 8 列!有没有比一次单独合并每个项目更简单的方法?您关于删除段落代码和行尾的讨论没有帮助;这不是问题,因为没有任何行尾,删除段落代码也没有任何区别。
答案1
任何像您所描述的大型重复性任务只有在计算机能够识别出明显特征的情况下才能实现自动化。例如,如果文本在第 5 个单词处被破坏。如果您能识别出这一点,那么您可以使用 VBA 中的宏来纠正问题。当然,情况并非总是如此,但根据您提供的有限信息,我们无法确定。
我建议您不要使用 Word,而是直接从 PDF 转换为 Excel。有多种免费在线服务可供您使用。但请注意,除非 PDF 只是一个表格,否则它不会正确转换。因此,请让我们知道它在转换后以何种方式出错,我们可以从那里为您提供帮助。
答案2
使用此应用程序,您可以在转换之前确定单元格的开始/结束位置: http://www.abbyy.com/finereader/
如果这只是一次性使用,我认为你可以试用一下。