我有一个包含 100,000 行的数据集。它的设置方式是,A 列包含一个组名,然后重复该组名,以表示该组的唯一成员数。我试图计算某个值出现两次和仅出现两次的次数。
- 值永远不会只出现一次 - 始终会有“组名”紧随其后,无论该组中有多少成员,都以单独的行显示。因此,对于任何不同的实体,始终至少有 2 行。
- 通常情况下,一个值会出现 3 次或更多次。
- 如果该值出现 3 次或更多次,我不想包含任何计数中的这些行。我实际上是在寻找不同对出现的次数。
答案1
将以下公式复制到 b 列中:
=COUNTIF($A$1:$A$100000,A1)=2
这将识别所有对。但是,它将显示对中的两个条目。在这些情况下,我通常会做的(即使这会破坏数据提供)是将此筛选列表复制到另一张表,然后删除重复项。
如果你想以可重复的方式做到这一点,以保持普罗维登斯,那么我建议在执行计数后使用唯一的列表类型数组公式
选项 B 是使用数据透视表,将值放在行的 A 列中,将 count(A) 放在值中,然后根据 count=2 的值筛选行
答案2
假设您的数据在 A1:A100000
1)将所有唯一值复制到单独的列中(使用数据->高级过滤器)——我将使用 C 列作为示例。
2)在 D1 中输入以下公式:=Countif(A$1:A$100000, C1)
然后为 C 中的每个唯一值填充 D 中的每个单元格。
3) 在另一个单元格中使用以下公式:(=Countif(D1:D??, 2)
其中 ?? 是 C 列和 D 列的最后一行)