如何选择多个数据文件的特定行

如何选择多个数据文件的特定行

我有很多这样的文件:

文件1:

 408.60 0.0847 
 370.03 0.1571 
 307.49 0.1492 
 297.12 0.0708 
 274.36 0.1989 
 251.27 0.1640 

文件2:

 391.06 0.0589 
 368.55 0.2293 
 313.87 0.0369 
 299.94 0.1432 
 288.61 0.2125 
 252.57 0.1238 

文件3:

 395.74 0.2439 
 372.76 0.0658 
 323.80 0.0026 
 287.41 0.3337 
 268.44 0.0860 
 259.44 0.0680 

我想根据选择标准选择每个输入文件的特定行。选择标准是:

a) 第一列必须是大于 290.00 的数字

b) 第二列必须是最大的数字

c) 打印该行

输出应该是这样的:

370.03 0.1571
368.55 0.2293
395.74 0.2439

答案1

直接解决

for file in file{1..3}; do
    sort -rk2 "$file" | awk '$1 > 290{print;exit}'
done

或者不使用 awk

for file in file{1..3}; do
    while read field1 field2 ; do
        [ "field1" -gt 290 ] && { echo $field1 $field2; break; }
    done <(sort -rk2 "$file")
done

或者单独 awk

awk '
    FNR == 1 || $1 > 290 && max < $2 {
        max = $2
        if (FNR == 1 && max) {
            print line
            if ($1 <= 290)
                max = -1     }
        line= $0                     }
    END {
        print line }
    ' file{1..3}

答案2

for f in file1 file2 file ; do cat $f | awk '{printf("%s %s\n",$2,$1)}' | sort -n | tail -n 1 | awk '{printf("%s %s\n",$1,$2)}' ; done

答案3

如果您有 GNU awk,这是一种方法,它的工作原理是使用第二个字段作为数组索引,并使用asorti在每个文件末尾的该索引上进行排序

gawk '
  BEGINFILE{delete a}
  $1+0 > 290 {a[$2]=$0; next;}
  ENDFILE{n = asorti(a,b); print a[b[n]]}
' file{1..3}
 370.03 0.1571 
 368.55 0.2293 
 395.74 0.2439

相关内容