我有两个文件:
文件1:
cluster17 7 Rde_Locus_34636 Rde_Locus_39558 Rde_Locus_44272 Rde_Locus_20977 Rde_Locus_50929 Rph_Locus_10923 Rph_Locus_65326
cluster18 7 Rde_Locus_1381 Rde_Locus_11734 Rde_Locus_4781 Rph_Locus_26879 Rph_Locus_7821 Rde_Locus_533 Rde_Locus_21493
cluster19 7 Rde_Locus_6450 Rde_Locus_10727 Rde_Locus_1801 Rde_Locus_25045 Rph_Locus_13685 Rph_Locus_6953 Rph_Locus_22248
cluster21 7 Rde_Locus_23138 Rde_Locus_10462 Rph_Locus_10145 Rph_Locus_49405 Rde_Locus_42639 Rph_Locus_70757 Rde_Locus_36462
文件2:
Rde_Locus_36462 M2
Rde_Locus_42639 S1
Rde_Locus_4781 M5
Rde_Locus_533 M3
Rde_Locus_6450 M1
Rph_Locus_10145 S4
Rph_Locus_13685 M2
Rph_Locus_22248 M4
Rph_Locus_26879 S5
我想加入这两个文件,以便输出为:
cluster17 7 Rde_Locus_34636 Rde_Locus_39558 Rde_Locus_44272 Rde_Locus_20977 Rde_Locus_50929 Rph_Locus_10923 Rph_Locus_65326
cluster18 7 Rde_Locus_1381 Rde_Locus_11734 Rde_Locus_4781_M5 Rph_Locus_26879_S5 Rph_Locus_7821 Rde_Locus_533_M3 Rde_Locus_21493
cluster19 7 Rde_Locus_6450_M1 Rde_Locus_10727 Rde_Locus_1801 Rde_Locus_25045 Rph_Locus_13685_M2 Rph_Locus_6953 Rph_Locus_22248_M4
cluster21 7 Rde_Locus_23138 Rde_Locus_10462 Rph_Locus_10145_S4 Rph_Locus_49405 Rde_Locus_42639_S1 Rph_Locus_70757 Rde_Locus_36462_M2
也就是说,将_$2
from附加File2
到 中的相应匹配项中File1
。我想答案是某种grep -f
组合sed
,但我正在努力解决这个问题。请注意,我无法使用join
,因为我无法排序File1
。
答案1
这是一种可能的方法 - 使用关联数组的查找表awk
:-
awk '
NR==FNR {
a[$1] = $1 "_" $2; next;
}
{
for (i=1;i<=NF;i++) {if ($i in a) $i = a[$i];}
}
1' file2 file1
如果您在此站点上搜索“join awk”,会有很多类似的示例。