Awk 使用哈希合并两个文件

Awk 使用哈希合并两个文件

我有两个长度相同的文件,我想用另一个文件的内容替换一个文件的 3 列。我想打印以下内容:

f1Col1 f1Col2 f1Col3 f1Col4 f1Col5 f1Col6 f2Col1 f2Col2 f2Col3 f1Col10 f1Col11 f1Col12

f1Col1其中 的第一列是,file1等等。

我尝试使用以下内容:

awk 'NR==FNR {h1[$1] = $1; h2[$2] = $2; h3[$3] = $3; next} {print $1,$2,$3,$4,$5,$6,h1[$1],h2[$2],h3[$3],$10,$11,$12}' file2 file1

它将打印 中的所有必需列,file1但打印的列却是空白,而不是 中的列file2。这有什么问题?

(注意:我使用的是 OS X Yosemite)

答案1

如果file2包含(例如)

The    quick    brown
fox    jumps    over
the    lazy     dog.

那么脚本的第一部分awk是设置

h1["The"]="The"
h2["quick"]="quick"
h3["brown"]="brown"
h1["fox"]="fox"
h2["jumps"]="jumps"
h3["over"]="over"
h1["the"]="the"
h2["lazy"]="lazy"
h3["dog."]="dog."

当您尝试在脚本的第二部分使用这些保存的值时,这没有任何用处;您需要按行号对数组进行索引:

h1[1]="The"
h2[1]="quick"
h3[1]="brown"
h1[2]="fox"
h2[2]="jumps"
h3[2]="over"
h1[3]="the"
h2[3]="lazy"
h3[3]="dog."

所以你的脚本需要

awk 'NR==FNR {h1[FNR] = $1; h2[FNR] = $2; h3[FNR] = $3; next}
{print $1,$2,$3,$4,$5,$6,h1[FNR],h2[FNR],h3[FNR],$10,$11,$12}' file2 file1

答案2

关于什么:

paste <(awk'{ print $1,$2,$3,$4,$5,$6 }' file1) <(awk '{ print $1,$2,$3 }' file2) <(awk '{ print $10,$11,$12 }' file1) 
  • paste 接受来自各个 awk 命令的输入
  • 通过将 awk 命令放在 '<()' 之间,只读取标准输出
  • paste 逐行合并三个输出文件

相关内容