我有一个相当大的 PDF,大约有 17,000 页。它们都是多列文本数据的相同格式。有没有办法只捕获特定列中的文本?我知道我可以通过 Alt-Select 来复制列中的文本,但这似乎仅限于每页。我需要收集整个列中的所有数据(总共约 17,000 页)。另一种选择是将所有文本复制到电子表格中,但这样做会丢失制表符信息,最终所有内容都会混杂在一起,以空格分隔而不是制表符分隔。
我有一个相当大的 PDF,大约有 17,000 页。它们都是多列文本数据的相同格式。有没有办法只捕获特定列中的文本?我知道我可以通过 Alt-Select 来复制列中的文本,但这似乎仅限于每页。我需要收集整个列中的所有数据(总共约 17,000 页)。另一种选择是将所有文本复制到电子表格中,但这样做会丢失制表符信息,最终所有内容都会混杂在一起,以空格分隔而不是制表符分隔。