保留uniq ID列中的最高匹配项

Question

$ awk -F'\t' 'NR==1 {print ; next};
              $3 > largest[$1] { largest[$1]=$3; line[$1] = $0 };
              END { for (id in largest) { print line[id] }}' input.txt 
1       R       55      1.94E-31        N/A     N/A     quinoa
2       F       62      1.94E-31        N/A     N/A     cat
3       N       97      1.94E-31        N/A     N/A     eagle

此 awk 脚本使用两个数组，一个用于跟踪每个 id ($1) 的最大值 $3，第二个用于记录关联的输入行。

读取并处理所有输入后，它会按 id 顺序打印出各行。

该NR==1 {print; next};行仅逐字打印出第一行（标题行），然后跳到下一个输入行。

Answer 1

$ awk -F'\t' 'NR==1 {print ; next};
              $3 > largest[$1] { largest[$1]=$3; line[$1] = $0 };
              END { for (id in largest) { print line[id] }}' input.txt 
1       R       55      1.94E-31        N/A     N/A     quinoa
2       F       62      1.94E-31        N/A     N/A     cat
3       N       97      1.94E-31        N/A     N/A     eagle

此 awk 脚本使用两个数组，一个用于跟踪每个 id ($1) 的最大值 $3，第二个用于记录关联的输入行。

读取并处理所有输入后，它会按 id 顺序打印出各行。

该NR==1 {print; next};行仅逐字打印出第一行（标题行），然后跳到下一个输入行。

保留uniq ID列中的最高匹配项

答案1

相关内容