Awk - 匹配两个文件之间的值并创建一个新文件

Question

这是一种方法：

$ awk -F"[, ]" 'NR==FNR{a[$1]=$1","$2; next} ($2 in a){print a[$2]","$1}' file1 file2 
1000,Brian,3044
400,Nick,4466
1010,Jason,1206

将-F"[, ]"字段分隔符设置为空格或逗号。FNR是当前行号和NR当前文件的当前行号。仅当读取第一个文件时，两者才会相等。因此，NR==FNR{a[$1]=$1","$2; next}将仅在第一个文件的行上运行，并将第一个和第二个字段（中间有逗号）保存为数组中的值，a其键是第一个字段。然后，当读取第二个文件时，如果第二个字段在中a，我们打印与其关联的值（第一个文件的第一个和第二个字段）以及第二个文件的第一个字段。

也就是说，实际上有一个应用程序可以做到这一点！这种东西就是join为之而生的。遗憾的是，由于您的两个文件未排序并且具有不同的分隔符，因此我们需要一些技巧。如果你的 shell 支持<()，你可以这样做：

$ join -t, -1 1 -2 2 <(sort file1) <(sed 's/ /,/g' file2 | sort -t"," -k2) 
1000,Brian,3044
1010,Jason,1206
400,Nick,4466

该join -t, -1 1 -2 2方法用作,分隔符并连接到 file1 的第一个字段和 file2 的第二个字段。只是sed用逗号替换空格，因此我们在两个文件中具有相同的分隔符。正如sort瓶子上所说的那样：它对输入进行排序。

Answer 1

这是一种方法：

$ awk -F"[, ]" 'NR==FNR{a[$1]=$1","$2; next} ($2 in a){print a[$2]","$1}' file1 file2 
1000,Brian,3044
400,Nick,4466
1010,Jason,1206

将-F"[, ]"字段分隔符设置为空格或逗号。FNR是当前行号和NR当前文件的当前行号。仅当读取第一个文件时，两者才会相等。因此，NR==FNR{a[$1]=$1","$2; next}将仅在第一个文件的行上运行，并将第一个和第二个字段（中间有逗号）保存为数组中的值，a其键是第一个字段。然后，当读取第二个文件时，如果第二个字段在中a，我们打印与其关联的值（第一个文件的第一个和第二个字段）以及第二个文件的第一个字段。

也就是说，实际上有一个应用程序可以做到这一点！这种东西就是join为之而生的。遗憾的是，由于您的两个文件未排序并且具有不同的分隔符，因此我们需要一些技巧。如果你的 shell 支持<()，你可以这样做：

$ join -t, -1 1 -2 2 <(sort file1) <(sed 's/ /,/g' file2 | sort -t"," -k2) 
1000,Brian,3044
1010,Jason,1206
400,Nick,4466

该join -t, -1 1 -2 2方法用作,分隔符并连接到 file1 的第一个字段和 file2 的第二个字段。只是sed用逗号替换空格，因此我们在两个文件中具有相同的分隔符。正如sort瓶子上所说的那样：它对输入进行排序。

Awk - 匹配两个文件之间的值并创建一个新文件

答案1

相关内容