匹配两个文件并打印第一次出现的行

Question 1

尝试这个，

grep -f file1 file2 | awk '!_[$2]++'

 1  C95696352 score:  -69.785 nathvy =  38 nconfs =          888
 3  C96209347 score:  -57.128 nathvy =  24 nconfs =         1188
 6  C89372772 score:  -55.728 nathvy =  22 nconfs =         3228
20  C85594749 score:  -49.780 nathvy =  44 nconfs =         4536

解释

grep -f file1 file2：在 file2 中搜索从 file1 获得的模式的匹配项
awk '!_[$2]++'$2：如果字段之前出现过，则不打印任何内容（通过）
- _是数组名称（可以是任何内容，例如“seen”）
- _[$2]++将创建一个数组条目，其键是字段的内容$2，并添加 1
- 如果_[$2]是不是( !) 已设置，则打印该行。该print命令是 awk 在条件匹配时执行的默认操作。

Answer

尝试这个，

grep -f file1 file2 | awk '!_[$2]++'

 1  C95696352 score:  -69.785 nathvy =  38 nconfs =          888
 3  C96209347 score:  -57.128 nathvy =  24 nconfs =         1188
 6  C89372772 score:  -55.728 nathvy =  22 nconfs =         3228
20  C85594749 score:  -49.780 nathvy =  44 nconfs =         4536

解释

grep -f file1 file2：在 file2 中搜索从 file1 获得的模式的匹配项
awk '!_[$2]++'$2：如果字段之前出现过，则不打印任何内容（通过）
- _是数组名称（可以是任何内容，例如“seen”）
- _[$2]++将创建一个数组条目，其键是字段的内容$2，并添加 1
- 如果_[$2]是不是( !) 已设置，则打印该行。该print命令是 awk 在条件匹配时执行的默认操作。

Question 2

仅使用 awk：

$ awk 'NR==FNR {a[$1]=1; next} $2 in a {print; delete a[$2]}' file1 file2
    1  C95696352 score:  -69.785 nathvy =  38 nconfs =          888
    3  C96209347 score:  -57.128 nathvy =  24 nconfs =         1188
    6  C89372772 score:  -55.728 nathvy =  22 nconfs =         3228
   20  C85594749 score:  -49.780 nathvy =  44 nconfs =         4536

Answer

仅使用 awk：

$ awk 'NR==FNR {a[$1]=1; next} $2 in a {print; delete a[$2]}' file1 file2
    1  C95696352 score:  -69.785 nathvy =  38 nconfs =          888
    3  C96209347 score:  -57.128 nathvy =  24 nconfs =         1188
    6  C89372772 score:  -55.728 nathvy =  22 nconfs =         3228
   20  C85594749 score:  -49.780 nathvy =  44 nconfs =         4536

匹配两个文件并打印第一次出现的行

答案1

答案2

相关内容