我有一个包含 120K 行的大型数据集。在这个数据集中,我有两列(第 1 列和第 2 列),其中第 2 列依赖于第 1 列。这个数据集来自 ERP 数据库,出于某种原因,第 2 列中有相同值的重复项。要删除这些重复项,我无法使用删除重复项功能,因为第 2 列中的重复值与第 1 列中的多个唯一值相关联。
例如,如果第 1 列中的值“A”在第 2 列中具有对应的值“111”,而第 1 列中的值“B”在第 2 列中具有对应的值“111”,则我不希望 Excel 假设它是重复的,因为它不是。在我的例子中,它只是意味着“111”在“A”和“B”中都使用。但如果“111”在值“A”或“B”中重复出现多次,那么我想删除这些重复项。我希望这有意义。这是我在这个论坛上的第一篇帖子,我不确定如何上传示例文件(因此我在下面创建了一个表格来显示数据的样子)。任何帮助都值得感激。
提前致谢
VJ
答案1
正如 Scott 所建议的删除重复项功能应该适合您。如果您的情况不同,那么您可能需要清楚地说明您的问题。