使用公共列值合并文件

Question 1

如果您不介意对文件进行排序，您可以使用join（虽然这对您的情况来说可能不实用，但看看如何完成会很有趣）

首先File 2按公共数字字段排序

sort -k2 "File 2" > file2clean

然后你join可以

sort -k5 "File 1" | join -a 1 -o 1.1 1.2 1.3 1.4 0 2.1 -1 5 -2 2 - file2clean | tee "File 3"

完成后，您可以删除中间部分file2clean。

Answer

如果您不介意对文件进行排序，您可以使用join（虽然这对您的情况来说可能不实用，但看看如何完成会很有趣）

首先File 2按公共数字字段排序

sort -k2 "File 2" > file2clean

然后你join可以

sort -k5 "File 1" | join -a 1 -o 1.1 1.2 1.3 1.4 0 2.1 -1 5 -2 2 - file2clean | tee "File 3"

完成后，您可以删除中间部分file2clean。

Question 2

我不知道对于你提到的大小的文件来说它会有多高效，但是既然你要求awk解决方案，那实际上只需要从第二个文件创建一个查找表，然后使用第一个文件的最后一个字段来输入它，例如

awk 'NR==FNR {a[$2]=$1; next} {$(NF+1) = a[$NF]} 1' file2 file1 > file3

请注意，您没有指定在没有匹配的情况下要做什么 - 在这种情况下，它将添加一个空字段。如果这不是所需的行为，您可以先测试是否$NF存在a。

Answer

我不知道对于你提到的大小的文件来说它会有多高效，但是既然你要求awk解决方案，那实际上只需要从第二个文件创建一个查找表，然后使用第一个文件的最后一个字段来输入它，例如

awk 'NR==FNR {a[$2]=$1; next} {$(NF+1) = a[$NF]} 1' file2 file1 > file3

请注意，您没有指定在没有匹配的情况下要做什么 - 在这种情况下，它将添加一个空字段。如果这不是所需的行为，您可以先测试是否$NF存在a。

相关内容