我尝试删除 CSV 文件的行,其中两列包含部分相同的值,如下所示:
ColA ColB ColC ColD
mydom/users/michael mydom2\michael blabla false
mydom/users/julia mydom2\sandra blabla true
mydom/users/charlie mydom2\charlie blabla false
mydom/users/max mydom2\albert blabla false
如果 ColA 在最后一个斜杠后包含相同的名称(例如 michael)与 ColB 在反斜杠后包含相同的名称(如第 1 行和第 3 行),则应删除整行。
有没有办法使用特殊标准来删除重复项?需要帮助,谢谢。
答案1
使用 Powershell,
Select-String -n -path file.csv -Pattern "/([^/,]+).*\\\1" | select -exp Line
-n
返回不匹配,模式是您想要的条件(对 CSV 文件的分隔符进行额外检查)。一旦测试完成,您就可以> new_file.csv
在行尾添加。