我有2个文件,
文件1->
abc=3
abc=3
dfg=6
ggg=7
文件2->
abc=3
dfg=4
sdf=9
我希望 file3 中的输出为,
File2,File1,Result
abc=3,abc=3,Match
dfg=4,dfg=6,NoMatch
sdf=9,,NotPresent
,abc=3,Duplicate
我目前有一个脚本,
grep -E 'abc|dfg|sdf' file1 >> file3
comm <( sort -n file2 ) <( sort -n file3 ) |awk -F$'\t' 'BEGIN { OFS="," } $3 { print $3, $3, "MATCH"; next } { print $1, $2, "NO MATCH" }' > final_result.txt
输出看起来像,
abc=3,abc=3,MATCH
,abc=3,NO MATCH
dfg=4,,NO MATCH
,dfg=6,NO MATCH
sdf=9,,NO MATCH
如果 file2 中的值与 file1 中的值不匹配,输出将显示空白。例如, dfg=4,,NO MATCH 和 ,dfg=6,NO MATCH 之间的唯一区别是该值已从 4 更改为 6。我希望输出为
dfg=4,dfg=6,NoMatch
代替
dfg=4,,NO MATCH
,dfg=6,NO MATCH
并且,
abc=3
出现两次,但显示为
,abc=3,NO MATCH
我想把它作为,
abc=3,,Duplicate
任何帮助是极大的赞赏。
答案1
bash-4.1$ cat file1
abc=3
abc=3
dfg=6
ggg=7
bash-4.1$ cat file2
abc=3
dfg=4
sdf=9
bash-4.1$ awk 'NR==FNR{split($0,B,"=");Brr[B[1]]=$0;Arr[$0]++;next}($0 in Arr){print $0","$0",Match";next}split($0,C,"=")(C[1] in Brr){print Brr[C[1]]","$0",NoMatch"}END{for (i in Arr)if(Arr[i]>1){print i",,Duplicate"}}' file1 file2
abc=3,abc=3,Match
dfg=6,dfg=4,NoMatch
,sdf=9,NoMatch
abc=3,,Duplicate