根据字段匹配合并 2 个文件

Question 1

$ awk 'FNR==NR{a[$1]=$2;next} ($1 in a) {print $1,a[$1],$2}' file2 file1
aa 45 32
bb 31 15
cc 50 78

解释：

awk隐式循环遍历每个文件，一次一行。由于我们将其file2作为第一个参数，因此首先读取它。 file1是第二个读的。

FNR==NR{a[$1]=$2;next}

NRawk是迄今为止已读取的行数，是当前文件中迄今为止已读取的FNR行数。awk因此，如果FNR==NR，我们仍在读取第一个命名文件：file2。对于中的每一行file2，我们分配a[$1]=$2.

这里，a是一个关联数组表示a[$1]=$2将 file2 的第二列（表示为）保存$2为数组中的值，并a使用 file2 的第一列$1作为键。

next指示awk跳过其余命令并从下一行开始。
($1 in a) {print $1,a[$1],$2}

如果我们到达这里，则意味着我们正在读取第二个文件：file1.如果我们在中看到该行的第一个字段file2（由 array 的内容确定）a，那么我们会打印出一行，其中包含两个文件中字段 2 的值。

Answer

$ awk 'FNR==NR{a[$1]=$2;next} ($1 in a) {print $1,a[$1],$2}' file2 file1
aa 45 32
bb 31 15
cc 50 78

解释：

awk隐式循环遍历每个文件，一次一行。由于我们将其file2作为第一个参数，因此首先读取它。 file1是第二个读的。

FNR==NR{a[$1]=$2;next}

NRawk是迄今为止已读取的行数，是当前文件中迄今为止已读取的FNR行数。awk因此，如果FNR==NR，我们仍在读取第一个命名文件：file2。对于中的每一行file2，我们分配a[$1]=$2.

这里，a是一个关联数组表示a[$1]=$2将 file2 的第二列（表示为）保存$2为数组中的值，并a使用 file2 的第一列$1作为键。

next指示awk跳过其余命令并从下一行开始。
($1 in a) {print $1,a[$1],$2}

如果我们到达这里，则意味着我们正在读取第二个文件：file1.如果我们在中看到该行的第一个字段file2（由 array 的内容确定）a，那么我们会打印出一行，其中包含两个文件中字段 2 的值。

Question 2

我喜欢 awk 解决方案，但我认为这可能更容易：

sort file1 > sortedFile1
sort file2 > sortedFile2
join -o 1.1 2.2 1.2 sortedFile1 sortedFile2

该选项-o将覆盖您选择的第一个文件的第一个字段、第二个文件的第二个字段和第一个文件的第二个字段的格式。

Answer

我喜欢 awk 解决方案，但我认为这可能更容易：

sort file1 > sortedFile1
sort file2 > sortedFile2
join -o 1.1 2.2 1.2 sortedFile1 sortedFile2

该选项-o将覆盖您选择的第一个文件的第一个字段、第二个文件的第二个字段和第一个文件的第二个字段的格式。

Question 3

将第二个文件加入File2到第一个文件中，File1.

join <(sort -k1 file2) <(sort -k1 file1)

Answer

将第二个文件加入File2到第一个文件中，File1.

join <(sort -k1 file2) <(sort -k1 file1)

相关内容