从源文件复制数据之前检查目标文件是否有重复条目

Question

为什么使用bash？该grep命令可以干净地完成这项工作。

grep -Fxvf target.txt source.txt #>> target.txt

这将返回仅存在于的那些行源文件.txt，然后您可以将这些行附加到您的 目标.txt只需取消注释即可#>> target.txt。

您可能还需要独特的源文件.txt之前，以防止附加重复的条目（如果在）源文件.txt文件，awk接下来也执行相同的操作。

grep -Fxvf target.txt <(sort -u source.txt) #>> target.txt

或者你也可以用它awk来代替。

awk 'NR==FNR{seen[$0]=1;next} !seen[$0]++' target.txt source.txt #>> target.txt

添加整体目标.txtseen文件到用整行的键调用的数组中seen[$0]，并执行next读取下一行。
我们!seen[$0]++正在寻找一条线源文件.txt数组中不存在的，然后打印它。还添加源文件.txt将行文件写入数组以防止打印重复行（如果 source.txt_ 中存在重复行）。

Answer 1

为什么使用bash？该grep命令可以干净地完成这项工作。

grep -Fxvf target.txt source.txt #>> target.txt

这将返回仅存在于的那些行源文件.txt，然后您可以将这些行附加到您的 目标.txt只需取消注释即可#>> target.txt。

您可能还需要独特的源文件.txt之前，以防止附加重复的条目（如果在）源文件.txt文件，awk接下来也执行相同的操作。

grep -Fxvf target.txt <(sort -u source.txt) #>> target.txt

或者你也可以用它awk来代替。

awk 'NR==FNR{seen[$0]=1;next} !seen[$0]++' target.txt source.txt #>> target.txt

添加整体目标.txtseen文件到用整行的键调用的数组中seen[$0]，并执行next读取下一行。
我们!seen[$0]++正在寻找一条线源文件.txt数组中不存在的，然后打印它。还添加源文件.txt将行文件写入数组以防止打印重复行（如果 source.txt_ 中存在重复行）。

相关内容