比较两个文件并显示匹配、重复和不匹配的输出

比较两个文件并显示匹配、重复和不匹配的输出

我有2个文件,

文件1->

abc=3
abc=3
dfg=6
ggg=7

文件2->

abc=3
dfg=4
sdf=9

我希望 file3 中的输出为,

File2,File1,Result
abc=3,abc=3,Match
dfg=4,dfg=6,NoMatch
sdf=9,,NotPresent
,abc=3,Duplicate

我目前有一个脚本,

grep -E 'abc|dfg|sdf' file1 >> file3
comm  <( sort -n file2 ) <( sort -n file3 ) |awk -F$'\t' 'BEGIN { OFS="," } $3 { print $3, $3, "MATCH"; next } { print $1, $2, "NO MATCH" }' > final_result.txt

输出看起来像,

abc=3,abc=3,MATCH
,abc=3,NO MATCH
dfg=4,,NO MATCH
,dfg=6,NO MATCH
sdf=9,,NO MATCH

如果 file2 中的值与 file1 中的值不匹配,输出将显示空白。例如, dfg=4,,NO MATCH 和 ,dfg=6,NO MATCH 之间的唯一区别是该值已从 4 更改为 6。我希望输出为

dfg=4,dfg=6,NoMatch 

代替

dfg=4,,NO MATCH
,dfg=6,NO MATCH

并且,

abc=3

出现两次,但显示为

,abc=3,NO MATCH

我想把它作为,

abc=3,,Duplicate

任何帮助是极大的赞赏。

答案1

bash-4.1$ cat file1
abc=3
abc=3
dfg=6
ggg=7

bash-4.1$ cat file2
abc=3
dfg=4
sdf=9


bash-4.1$ awk 'NR==FNR{split($0,B,"=");Brr[B[1]]=$0;Arr[$0]++;next}($0 in Arr){print $0","$0",Match";next}split($0,C,"=")(C[1] in Brr){print Brr[C[1]]","$0",NoMatch"}END{for (i in Arr)if(Arr[i]>1){print i",,Duplicate"}}' file1 file2
abc=3,abc=3,Match
dfg=6,dfg=4,NoMatch
,sdf=9,NoMatch
abc=3,,Duplicate

相关内容