我有两个电子邮件列表需要比较。一个有 160,000 个电子邮件地址。另一个有 10,000 个。我想知道的是,这 10,000 个中有多少个不存在于更大的列表中。
我尝试过使用不同的公式,但对我而言似乎没有什么作用。
答案1
假设您的电子邮件地址大列表在 A 列,从 A1 到 A160000。较小的列表在 B 列,从 B1 到 B1000。
一个简单的countif
公式应该可以回答您的问题。将此公式放在 C1 中,然后将其拖到 C1000:
=COUNTIF(A:A,B1)
此公式返回单元格 B1 中的值出现在 A:A 范围内的次数,这意味着整个 A 列。您也可以用 A1:A160000 替换 A:A。
如果 B 列中的任何电子邮件地址未出现在 A 列中,则在 C 列中它们旁边都会显示“0”。如果您想要较小列表中唯一的完整电子邮件地址列表,只需过滤 B 列和 C 列(找到“数据”选项卡下的“过滤器”按钮)并选择“0”作为 C 列的过滤器,所有其他值都将被隐藏。
答案2
您没有提供那么多信息,因此我很难说什么对您有用,但过去对我有用的方法如下:
=IFERROR(INDEX('Sheet2'!A:A,MATCH(A1,'Sheet2'!D:D,0)), "No Duplicate")
我来详细解释一下:
MATCH(A1,'Sheet2'!D:D,0)
是使用来查找完全匹配A1
,并且Sheet2!D:D
应该是您的 160,000 个电子邮件地址的列,并且0
仅指示完全匹配。
INDEX('Sheet2'!D:D,MATCH(A1,'Sheet2'!D:D,0)
将返回 Sheet2 D:D 中匹配的电子邮件地址(在您的情况下不需要)。
最后IFERROR
将为您提供“无重复”或匹配的电子邮件地址。
我确信有更好的方法可以做到这一点,但希望这对您有用。