MS Excel:多重筛选/检查另一列中已存在哪些字符串

MS Excel:多重筛选/检查另一列中已存在哪些字符串

我有两组独立的大数据(+25k行):

年份 CCS KPF
年份 MMS MS

截图在这里

CCS 和 MMS 分别表示字符串变量。我如何识别哪个字符串已经在哪个列表中?我想消除冗余,只保留 MMS 中的字符串。我不想删除重复项,顺序也很重要。

谢谢你!

答案1

我不确定您所说的不删除字符串是什么意思。如果您只想识别重复项而不删除它们,您可以在每个数据集中使用条件格式。在 CCS 列中,根据“使用公式确定要格式化的单元格”创建条件格式,然后输入类似这样的公式(根据您的工作表定制)。

=NOT( ISNA( MATCH( B2, CCS!$B$2:$B$7, 0 ) ) )

同样,在 CCS 列中,使用类似的公式设置相同的条件格式,例如:

=NOT( ISNA( MATCH( B2, MMS!$B$2:$B$7, 0 ) ) )

请注意,B2 必须使用相对地址,而不是锁定寻址,并且范围必须锁定。此外,两个表必须位于同一工作簿中。

在此处输入图片描述

如果您想要“删除冗余内容,只保留 MMS 中的字符串”,那么“删除”的含义就不明确了。您可以手动删除 CCS 中突出显示的内容。此外,关于“顺序很重要”的观点在此上下文中也不清楚。

公式:

=NOT( ISNA( MATCH( B2, MMS!$B$2:$B$7, 0 ) ) )

可以将其添加为 CCS 列表中的一个名为 Duplicates 的列,以及一个手动填充数字(1、2、3...)的列,标题为 SortKey。然后,您可以按 Duplicated 排序,并在 CCS 中手动删除重复项,然后使用 SortKey 将其恢复 - 然后删除 SortKey 列。

相关内容