0
我有一个 Excel 文件,其中包含网站用户的数据。AI 列中有用户名,BI 列中有电子邮件地址。不幸的是,有很多重复项:既在同一列中,又跨列。
例子:
- Thelegend28 |[电子邮件保护]
- timmyhs |[电子邮件保护]
- 暂无说明,留下第一条![电子邮件保护]
- Thelegend28 |[电子邮件保护]
- 2l33t4u |[电子邮件保护]
- timmyhs |[电子邮件保护]
如您所见,我不仅有使用相同用户名和电子邮件注册两次的用户(2.和6.),而且有时还有链接到同一封电子邮件的不同唯一用户名(3.和5.)和链接到多个地址的用户名(1.和4.)。
如果可能的话,我需要做的是以不同的方式格式化这三种情况。
当然,任何帮助都会非常感激。我只是个菜鸟,但我正在努力学习。提前谢谢大家。
答案1
答案2
正如往常一样,有很多方法可以解决 Excel 问题。
使用数据透视表并计算三个单独表中出现的次数(数据透视表比听起来简单 - 只需观看 YouTube 视频 - 它会改变你的人生观,嗯,我的意思是 Excel)。一个表用于重复的用户名,一个表用于重复的电子邮件地址,一个表用于两者(将 A1 和 B1 合并到新的 C 列中,使用 =A1&";"&B1)。每列一个数据透视表。这对于手动处理(例如批量给用户发送电子邮件、更新网站数据库等)可能很有效,但对于删除或编辑源电子表格中的重复行则不太适用。Ps. 不要忘记,您可以通过双击单元格从数据透视表中“向下钻取”。
对于原始数据的颜色格式,条件格式可以满足您的需求。保留新的 C 列,如上所示。一次选择一列,单击主页 > 条件格式 > 突出显示单元格规则 > 重复值...,然后为每列设置您喜欢的格式。此方法可以在一行内提供不同的颜色格式,而不是将一行标记为仅属于一个类别。
如果您想要更具体一点,请使用 COUNTIF 函数按如下方式对每行进行分类。再次保留新的 C 列,如上所示。假设您的数据是 A1:C10,那么在 D1 中输入
=IF(COUNTIF($A$1:$A$10,A1)>1,1,0) + IF(COUNTIF($B$1:$B$10,B1)>1,2,0) + IF(COUNTIF($C$1:$C$10,C1)>1,1,0)
这会将 0 表示唯一,将 1 表示重复的用户名,将 2 表示重复的电子邮件地址,将 4 表示完全重复,将 3 表示同时具有重复的电子邮件和用户名的特殊类别(例如 john[电子邮件保护]; 约翰[电子邮件保护];约翰尼[电子邮件保护])。然后,您可以使用自定义“图标集”有条件地格式化 D 列,其中包含 5 个不同的图标(0、1、2、3、4)。