删除两个压缩文件中的重复项

删除两个压缩文件中的重复项

我有两个压缩文件,其值按列组织。

我需要检查每个文件中的第一列,并从第一个文件中删除重复的值,并将其保留在第二个文件中。

答案1

您需要将文件的路径放入脚本中,然后运行它。

使用这些示例文件测试了脚本:

file1.csv:

11,0
12,b
14,z

file2.csv:

12,a
13,b
14,c

out.csv:

11,0

del_dup.sh:

#!/bin/bash

FILE1=./file1.csv
FILE2=./file2.csv
FILE3=./out.csv

IFS=$'\n' 
for line in $( cat $FILE1 ); do
        ID1="$( echo $line | cut -d ',' -f1 )"
        if [ -z "$( cat $FILE2 | grep ^"$ID1" )" ]; then
                echo $line >> $FILE3
        fi
done

相关内容