问题是我有 300.000 个条目
Colum A = YEAR
Colum B = month
Colum C = customer number
G5 to G13 = criteria
我想计算每年有多少个独立客户 - 我尝试使用数组公式 - 但对于如此庞大的数据集来说这并不好......我想......
使用公式
=SUM(--(FREKVENS(HVIS(A:A=G5;SAMMENLIGN(C:C;C:C;0));RÆKKE(B:B)-RÆKKE(C1)+1)>0))
或英文:
=SUM(--(FREQUENCY(IF(A:A=G5,MATCH(C:C,C:C,0)),ROW(B:B)-ROW(C1)+1)>0))
如果我的数据集很小,这个方法就很好用了,但是对于我的数据集,它刚开始计算,然后在几个小时内保持 100% 的 CPU 状态
那我该怎么办?
答案1
使用 DB 不是一个选项 - 因为其他人应该能够使用它 :(
我做出的解决方案虽然不太好,但确实有效
1)复制所有客户并删除重复项2)使用 VLOOKUP 查找年份(因为列表是反向排序的,所以它会获取我第一次看到客户的时间)3)现在我以年份为标准进行简单的 countif。
不太好看,特别是因为我必须复制 2) 向下 465.451 行