与另一个 CSV 文件相比,删除 CSV 文件中的重复行

与另一个 CSV 文件相比,删除 CSV 文件中的重复行

我有一个名为 CSV1 的 CSV 文件,其中包含 5000 多行和 3 列 - 姓氏、名字和电子邮件地址。我还有另一个名为 CSV2 的文件,其中包含大约 2700 行和相同的 3 列。我必须从 CSV1 中删除 CSV2 中的条目。我该怎么做?请帮忙:)

答案1

使用 python 可能是一种简单的方法。如果你会使用 python,你可以尝试:

entries = []
entries2 = []
with open('CSV2.csv', 'r') as my_file:
    for line in my_file:
        columns = line.strip().split(',')
        if columns not in entries:
            entries.append(columns)
        
with open('CSV1.csv', 'r') as my_file:
    for line in my_file:
        columns = line.strip().split(',')
        if columns not in entries:
            entries2.append(columns)

with open('CSVnodup.csv', 'w') as out_file:
    for i in entries2:
        out_file.write(','.join(i))

相关内容