我想知道是否有办法解决 excel 的问题:
我有一个包含超过 100k 行的文件,每次我在列中使用过滤器时,它实际上并不会显示所有内容,这是一个错误,它有时会缺少一些行,这迫使我重新启动工作才能查看我错过了什么。
有谁知道,优化此类文件的最佳方法是什么以及可以使用哪些功能?
将文件分割成 3-4 个不同的文件是可行的方法吗?我想知道是不是因为文件太大了
答案1
我创建了一个包含六列的 100,000 行范围,设置了列过滤器,然后查看 Excel 允许我处理哪些行。
它显示了“可勾选”选项,包括 10,002 个。有趣的是,当我点击“并非所有项目都显示”时...它给出了以下错误消息:
This column has more than 10,000 unique items. Only the first 10,000 unique items are displayed.
(它没有显示第 1 行的条目,因为过滤功能似乎将第一行视为标题行,句号,所以它实际上显示的是 10,001,而不是 10,002,有趣的是,“10,001”不是所述的“10,000”。)
我删除了多余的列以查看它是否根据范围大小而变化并收到相同的消息,因此这与内存使用情况没有直接关系。
因此,从表面上看,在没有更多信息的情况下,是的,您需要将数据分成几个表才能按原样处理。具体数量取决于您过滤的列中 UNIQUE 值的数量。
但是,这完全取决于您的工作以及您的组织允许的内容。例如,如果您直接对数据进行操作,例如查找记录,然后更改或删除行中的材料或添加/删除行本身,那么您必须将数据分开。
但是,如果您使用找到的信息来做实际数据以外的工作,则可以使用该FILTER()
功能设置工作表以查找和显示所需的数据。 (其结果本身可以进行过滤。)
这里有很多可能性,并且可以对列进行有趣的调整:按照您希望的任何顺序,丢失一些列,使列出现多次,诸如此类,如果您用INDEX()
(对于某些,但不是所有的灵活性,用另一个FILTER()
)包裹它。
超越这些“在宇宙中”的极端,您可以使用 Power Query 对数据进行多种工作。而且 PQ 可以比 Excel 的过滤功能更精细、更稳健地“过滤”您必须处理的材料。并且可以输出到您可以使用的表格(如果您喜欢或需要混合使用方法(在 PQ 中进行记录选择(以及列选择和排序),然后输出到表格以按照您习惯的方式进行工作)。
这完全取决于您所做的具体工作。
如果您熟悉 VBA 并且允许使用它,VBA 几乎可以做任何此类事情,并且可以进行调整以精确满足您的需求。
因此,根据您所做的工作和组织考虑,您可能必须将表分成几部分,或者根本不必这样做。
如果您这样做,关键在于过滤列中有多少个 UNIQUE 项。因此,即使每个过滤数据范围的限制似乎是“10,000”,但您可能只需要两个表,而不是三个/四个,或者十个或更多,因为有些数据项不是唯一的。