如何将 PDF 中的表格导出到电子表格中?

如何将 PDF 中的表格导出到电子表格中?

我想转换此 PDF其中包含一个表格,转换为与 Excel 兼容的电子表格,用于制作闪存卡。

是否有人知道一种自动的方法来做到这一点,而不需要手动将每个短语复制到正确的列中?

答案1

  1. PDF 格式的诞生(20多年前)从未打算成为可提取、有意义的结构化数据的主机

  2. 它的最初目的是成为文档中文本、图像和图表的可靠视觉表示——一种数字纸(也可以通过打印可靠地转移到真实纸张上)。直到后来才添加了更多功能,其中包括一些有助于再次提取数据的功能(谷歌搜索带标签的 PDF)。

  3. 有关从 PDF 中抓取数据表时遇到的一些问题的示例,请参阅此文章:

  4. 与我上面的观点‘1’相矛盾现在我要说的是:对于用于从 PDF(除非它们是扫描的页面)中提取表格数据的令人惊叹的工具系列,它们每周都变得越来越好,请参阅以下链接:

所以:去寻找 Tabula。如果任何工具都能满足您的需求,那么目前(提出这个问题 4 年后)Tabula 可能是最适合这项工作的工具之一!


附言:Tabula 是一款免费的开源软件,用 Ruby 编写。

答案2

将 PDF 文件转换为 Microsoft Excel 文档,提取表格。这款免费的 PDF 转换器和 PDF 创建器快速可靠。希望这对您有所帮助

http://www.freepdfconvert.com/pdf-excel

答案3

我知道这是一篇老帖子,但有很多免费工具可用于一次性转换。以下是一些示例:

如果你用 Google 搜索,你会找到更多PDF Table to Excel

相关内容