如何以纯文本形式获取此PDF中的数据?

如何以纯文本形式获取此PDF中的数据?

这个文件从第 5 页开始,写了许多行数据。我需要纯文本格式的这些行。我该如何提取它们?

答案1

您可以使用以下方式将 PDF 内容转换为纯文本pdf转文本

只需运行pdftotext Appendix.pdf它就会输出Appendix.txt其中的所有纯文本。

答案2

简单地复制它们有什么问题吗?

Cartesian coordinates for all structures:

React

6 6.390727 0.132095 4.960391
6 5.969971 -1.321389 4.932512
8 6.229932 -2.095504 5.854485
7 5.288242 -1.652799 3.816634
6 4.675691 -2.942048 3.614359
6 3.234362 -2.800745 3.119131
6 3.107771 -2.046443 1.784738
8 3.907686 -1.094593 1.556228
8 2.188216 -2.443833 1.008985
6 -5.322697 -1.975980 -1.333635
6 -4.229638 -1.620947 -0.307343
16 -2.533574 -1.760488 -0.994608
6 8.431743 -0.064459 -3.050202
6 7.281182 -0.571938 -2.237196
6 7.017856 -0.342487 -0.904258
6 6.208644 -1.400670 -2.720284
7 5.852218 -0.976787 -0.527814

答案3

  1. 将文档保存至本地机器。

  2. http://www.pdfonline.com/pdf-to-word-converter/将 pdf 转换为 Word。较大的文档可能只能部分转换,因此您可能必须分块转换。

  3. 在 Word '07 中,文件 --> 选项 --> 高级 --> “在文档内粘贴”和“在文档之间粘贴”,设置为“仅保留文本”。

  4. 将一个文档中的数据剪切/粘贴到其自身中,将其他文档中的数据剪切/粘贴到第一个文档中。

此后,您将得到 1 个纯文本的大 Word 文档。

相关内容