Excel,计算符合条件的唯一值 - 巨大的数据集

Excel,计算符合条件的唯一值 - 巨大的数据集

问题是我有 300.000 个条目

Colum A = YEAR
Colum B = month
Colum C = customer number

G5 to G13 = criteria

我想计算每年有多少个独立客户 - 我尝试使用数组公式 - 但对于如此庞大的数据集来说这并不好......我想......

使用公式

=SUM(--(FREKVENS(HVIS(A:A=G5;SAMMENLIGN(C:C;C:C;0));RÆKKE(B:B)-RÆKKE(C1)+1)>0))

或英文:

=SUM(--(FREQUENCY(IF(A:A=G5,MATCH(C:C,C:C,0)),ROW(B:B)-ROW(C1)+1)>0))

如果我的数据集很小,这个方法就很好用了,但是对于我的数据集,它刚开始计算,然后在几个小时内保持 100% 的 CPU 状态

那我该怎么办?

答案1

使用 DB 不是一个选项 - 因为其他人应该能够使用它 :(

我做出的解决方案虽然不太好,但确实有效

1)复制所有客户并删除重复项2)使用 VLOOKUP 查找年份(因为列表是反向排序的,所以它会获取我第一次看到客户的时间)3)现在我以年份为标准进行简单的 countif。

不太好看,特别是因为我必须复制 2) 向下 465.451 行

相关内容