我想从 pdf 文件重新创建表格。我可以复制整个内容,粘贴后变成(本例中已简化):
“列 1 列 2 列 3 10 20 30 5 6 7 100 250 350”。
当使用空格分隔的文本到列时,Excel 会将所有内容都变成列标题。有没有办法告诉 Excel 我想要 3 列,这样它就会“包装”以下值?这样输出就变成:
列1 | Col2 | Col3 |
---|---|---|
10 | 20 | 三十 |
5 | 6 | 7 |
100 | 250 | 350 |
谢谢你的帮助!
答案1
不可以,“文本到列”(“T2C”)向导(以及其更广泛的,因此是其父级的“导入向导”)无法做到这一点。完全没有。
但是,您可以通过 Power Query 实现这一点,但这需要“做一些事情”,就像学习有关 PQ 的更多信息,而不仅仅是移动列和重新输入列数据。
不过,你可以解决这个问题。
选择一个包含内容的单元格。任何这样的单元格。启动 T2C。按照分隔路径选择一个/多个分隔符。确保复选框被Space
选中。一旦该复选框被选中,立即退出向导(您不想转换您选择的任何单元格)。
复制材料并将其粘贴到您想要的单元格中。确保您选择一个右侧有足够空间的单元格。如果粘贴时带有问题中显示的双引号,则只需执行两个步骤。如果没有,则此粘贴会直接将数据粘贴到 12 列中。
选择单元格。我假设现在只有一个单元格,但接下来是一列粘贴。启动 T2C 并转到分隔路径,然后使用Finish
完成它。如果它是双引号,这将删除双引号。一旦双引号消失(如果愿意,您可以直接编辑它们),按照分隔路径再次执行 T2C,您将获得 12 列。
如果您有一个单元格要添加到 T2C,只需选择输出的第 4-6 列,然后将其拖到粘贴单元格下方以及其右侧的两列。然后是第 7-9 列,然后是第 10-12 列。
令人恼火,但已成定局。
如果您粘贴了多个数据单元格,也可以执行相同的操作,只是粘贴的是单元格块,而不是行。如果它们的顺序很重要,请在原始列 4、7 和 10 的左侧插入列,将 1 放在第一行,将 2 放在第二行,将 3 放在第三行,依此类推。按照说明移动块,但也包括每个块的编号列,将其放在“Col1”列左侧的列中。移动所有行后,Sort
非“Colx”行将按该编号列移动。所有 1 都会向上移动,依此类推,并且通过不按任何其他列排序,您可以保持移动块本身的顺序。所以现在您有了 PDF 的原始表格行顺序。
我以前也遇到过这个问题,而且更糟糕的是,由于 PDF 是一个程序,而不是文档,有时表格中的材料会散落在各处,而您收集的远不止表格,而且全都是不相关的。太可怕了。
使用 Acrobat(“X”,不是“DC”,但也许 DC 有类似的功能,虽然我买了一台新电脑并因为脑子不灵光而卸载它时它没有类似的功能),人们可以用它Ctrl-Mouse
在屏幕的某个部分周围画一个矩形,并让它复制“图片”,但它会通过 OCR 将其转换为它可以制作的任何内容。由于人们会小心地画出矩形,以包含正在复制的文本周围的一些空白,但要非常小心,不要包含任何其他零散的部分(粗心大意是不会得到奖励的!),多年来,我使用 OCR 功能从未失败过。(顺便说一句,如果在某种情况下这很困难,请增加放大倍数,直到不难做到。这没关系,而且边缘不会有任何杂散的碎片。)
然后粘贴到 Excel 中。它对我来说总是很有效。保持了精确的顺序,并且没有插入 PDF 中不相关的材料。您创建的图片正是所显示的内容,而不是从图片中文本存储在文件中的位置以及该文本从开始到结束点的边界内的任何内容绘制的。
(对我来说,国税局出版税表总是最糟糕的,最糟糕的。这甚至解决了这些问题。虽然......生活就是这样......现在,直接复制/粘贴对他们来说通常很有效。但我知道,如果我从未发现这一点,他们就永远不会提高他们的水平......)
另外,我应该提到,每个不同的 PDF 创建者创建它们的方式都不同,因为创建过程中遵循的路径不同,输出文件也不同。通过 2-3-4 种方式在计算机上创建“相同”的 PDF(相同的源文档)并比较输出文件。或者使用您可能使用的任何 PDF 编辑器打开 PDF 并立即将其从该编辑器导出为 PDF,然后将该输出文件与您打开的文件进行比较。PDF 创建者所要求的只是屏幕上或打印的输出看起来像原始材料。这就是为什么直接复制和粘贴,通常还有 PQ,并不总是那么好用的原因……变化太大,而且有太多愚蠢的创建选择破坏了数据完整性。