使用 awk 替换列

使用 awk 替换列

我运行以下代码替换两个文件的第二列(file2file3) 与文件中的第 12 列source.dat,基于该文件的第 9 列应与和source.dat的第一列匹配。file2file3

到目前为止,我尝试过

for f in fil*; do 
    awk 'NR==FNR{ar[NR]=$12;next} {for (i=1;i<=length(ar);i++) if (FNR==i) $2=ar[i]}1' source.dat "$f" > temp
    awk '{printf("%.4f %12.8f     1.000     1    1\n", $1, $2)}' temp > "${f}_bvs"
done

from 的输出file2是正确的,除了最后包含一个额外的行;但是, 的输出file3在第二列中包含其他值。请问有什么问题吗?

  • 源文件
        1 2000 11 11  7  9 45  840                         49667.8048  18.33  HeI  6.10352e-05
        2 2000 11 11  8 56 57  660                         49667.8782  18.15  HeI   0.00546265
        3 1994 11 12  5 18 10 1020                         49668.7284  18.34  HeI  -0.00497437
        4 1994 11 12  7 35 30  840                         49668.8227  18.14  HeI  -0.00357056
        5 1994 11 12  9  6 42  720                         49668.8854  17.99  HeI  -0.00476074
        6 1994 11 14  5 20 43  600                         49670.7279  18.04  HeI  -0.00326538
        7 1994 11 14  7 32 46  630                         49670.8197  17.84  HeI  -0.00598145
        8 3000 11 14  9 21 14  540                         49670.8945  17.66  HeI   0.00701904
        9 1994 11 15  5 21 14  610                         49671.7283  17.88  HeI  -0.00100708
       10 4445 11 15  7  4  5  540                         49671.7994  17.73  HeI  -0.00503540
       11 1994 11 15  9  1 14  600                         49671.8811  17.53  HeI     0.000000
       12 1996  1 11  0 56  4  301                         50093.5444   2.26  HeI   0.00570679
       13 1996  1 11  1  2 30  601                         50093.5506   2.25  HeI   0.00424194
       14 1996  1 11  1 15 23  541                         50093.5592   2.23  HeI   0.00100708
       15 1996  1 11  1 26 29  420                         50093.5662   2.22  HeI   0.00372314
    
  • 文件2
    49667.8048   78.450     3.000     1    1
    49667.8782   79.900     1.000     1    1
    49668.7284   40.890     1.000     1    1
    49668.8227   45.790     1.000     1    1
    49668.8854   49.770     5.000     1    1
    49670.7279   66.060     1.000     1    1
    49670.8197   47.380     1.000     1    1
    49670.8945   27.270     6.000     1    1
    49671.7283   66.190     1.000     1    1
    49671.7994   65.320     6.000     1    1
    49671.8811   62.290     1.000     1    1
    
  • 文件3
    50093.5444   13.480     1.000     1    1
    50093.5506   14.830     1.000     1    1
    50093.5592   12.150     1.000     1    1
    50093.5662   12.150     1.000     1    1
    

电流输出

  • 对于文件2
    49667.8048   0.00006104     1.000     1    1
    49667.8782   0.00546265     1.000     1    1
    49668.7284  -0.00497437     1.000     1    1
    49668.8227  -0.00357056     1.000     1    1
    49668.8854  -0.00476074     1.000     1    1
    49670.7279  -0.00326538     1.000     1    1
    49670.8197  -0.00598145     1.000     1    1
    49670.8945   0.00701904     1.000     1    1
    49671.7283  -0.00100708     1.000     1    1
    49671.7994  -0.00503540     1.000     1    1
    49671.8811   0.00000000     1.000     1    1
    0.0057   0.00000000     1.000     1    1
    
  • 对于文件3
    50093.5444   0.00006104     1.000     1    1
    50093.5506   0.00546265     1.000     1    1
    50093.5592  -0.00497437     1.000     1    1
    50093.5662  -0.00357056     1.000     1    1
    

答案1

您应该能够使用以下方法来做到这一点join

~$ join -1 1 -2 9 -o 1.1,2.12,1.3,1.4,1.5 file2 source.dat 
49667.8048 6.10352e-05 3.000 1 1
49667.8782 0.00546265 1.000 1 1
49668.7284 -0.00497437 1.000 1 1
49668.8227 -0.00357056 1.000 1 1
49668.8854 -0.00476074 5.000 1 1
49670.7279 -0.00326538 1.000 1 1
49670.8197 -0.00598145 1.000 1 1
49670.8945 0.00701904 6.000 1 1
49671.7283 -0.00100708 1.000 1 1
49671.7994 -0.00503540 6.000 1 1
49671.8811 0.000000 1.000 1 1

~$ join -1 1 -2 9 -o 1.1,2.12,1.3,1.4,1.5 file3 source.dat
50093.5444 0.00570679 1.000 1 1
50093.5506 0.00424194 1.000 1 1
50093.5592 0.00100708 1.000 1 1
50093.5662 0.00372314 1.000 1 1

这将指示分别在第 1 列和第 9 列上join匹配file2(或file3)作为第一个文件和第二个文件 ( ) 并输出第一个文件的第一列、第二个文件中的第 12 列,然后输出剩余的列(原始列除外) 2) 从第一个文件开始。source.dat-1 1 -2 9

编辑

看来这是一个后续问题上一个问题,并且您想使用 来实现这一点awk。在这种情况下,请尝试

~$ awk 'FNR==NR{v[$9]=$12;next} {print $1,v[$1],$3,$4,$5}' source.dat file2 
49667.8048 6.10352e-05 3.000 1 1
49667.8782 0.00546265 1.000 1 1
49668.7284 -0.00497437 1.000 1 1
49668.8227 -0.00357056 1.000 1 1
49668.8854 -0.00476074 5.000 1 1
49670.7279 -0.00326538 1.000 1 1
49670.8197 -0.00598145 1.000 1 1
49670.8945 0.00701904 6.000 1 1
49671.7283 -0.00100708 1.000 1 1
49671.7994 -0.00503540 6.000 1 1
49671.8811 0.000000 1.000 1 1

~$  awk 'FNR==NR{v[$9]=$12;next} {print $1,v[$1],$3,$4,$5}' source.dat file3
50093.5444 0.00570679 1.000 1 1
50093.5506 0.00424194 1.000 1 1
50093.5592 0.00100708 1.000 1 1
50093.5662 0.00372314 1.000 1 1

或者,在一个循环中

for f in file*; do awk 'FNR==NR{v[$9]=$12;next} {print $1,v[$1],$3,$4,$5}' source.dat "$f" > "${f}_bvs"; done

相关内容