AWK:提取值与另一个文件中的值匹配且小于另一个文件中的值的行?

AWK:提取值与另一个文件中的值匹配且小于另一个文件中的值的行?

我的 Linux 机器上有一个名为file1以下内​​容的文件:

ID        Time                    Energy
43 4.38665978376386365240533e-05 3.215e-02
43 4.38666558838421885677290e-05 4.788e-01
48 4.77674337753321466689890e-05 1.750e-01
48 4.77674676992522297732519e-05 3.360e-01
52 4.99184267458611271553633e-05 3.110e-01
52 4.99184755438830858337990e-05 2.000e-01
203 2.17111141925415134391192e-04 0.000e+00
203 2.17111189970080955017814e-04 1.685e-01
203 2.17111190317825032474949e-04 3.425e-01
206 2.17705422992319207490738e-04 3.197e-01
206 2.17705445825075834731174e-04 1.913e-01
245 2.54300470583329032894099e-04 2.130e-01
245 2.54300477743886715713273e-04 2.679e-02
245 2.54300499465897461830871e-04 4.887e-02
245 2.54300511632548666141052e-04 0.000e+00
245 2.54300542217183317417195e-04 0.000e+00
245 2.54300549393671508017351e-04 2.224e-01

file2

ID   Time                         Energy
43  4.38666558838421885677290e-05 4.788e-01
48  4.77674676992522297732519e-05 3.360e-01
52  4.99184267458611271553633e-05 3.110e-01
203 2.17111190317825032474949e-04 3.425e-01
206 2.17705422992319207490738e-04 3.197e-01
245 2.54300549393671508017351e-04 2.224e-01

我想读取,如果 中存在file1一行的能量值,我应该打印上一行。 file1file2

上面示例的所需输出是:

43 4.38665978376386365240533e-05 3.215e-02
48 4.77674337753321466689890e-05 1.750e-01
52 4.99184267458611271553633e-05 3.110e-01
203 2.17111189970080955017814e-04 1.685e-01
206 2.17705422992319207490738e-04 3.197e-01
245 2.54300542217183317417195e-04 0.000e+00

问题是:在同一个ID号下,当file1中某一行的能量值存在于file2中时,打印该行之前的行。谁能知道如何用 awk 做到这一点?我试过代码:

gawk '
NR==FNR {a[NR]=$0; next }
{
    split(a[FNR],flds,FS,seps)
    if(flds[1]=$1 && flds[2] <=$2)
  print flds}' file1 file2 > flie3

然后使用排序 | uniq 删除具有相同 id 的重复行。

所有文件中的时间值都是递增的,一旦与文件2具有相同能量值的行位于同一ID号内的第一行,则仅选择该行。喜欢52 4.991842674586112715536​​33e-05 3.110e-01

答案1

awk '
  NR==FNR{ if (FNR>1)a[$1]=$3; next } # file2: save ID,Energy value in array `a`
  $1 in a{                            # file1: if ID is present in array
     if (a[$1] != $3){                # if it is not the same Energy value...
       prev=$0                        # save previous line
     }
     else {                           # it is the same Energy value...
       print (prev=="") ? $0 : prev   # print previous line if saved or current line
       prev=""                        # reset previous line
     }
  }
' file2 file1 > file3

输出:

43 4.38665978376386365240533e-05 3.215e-02
48 4.77674337753321466689890e-05 1.750e-01
52 4.99184267458611271553633e-05 3.110e-01
203 2.17111189970080955017814e-04 1.685e-01
206 2.17705422992319207490738e-04 3.197e-01
245 2.54300542217183317417195e-04 0.000e+00

相关内容