需要使用 awk 基于具有多对一关系的两列来过滤数据

Question

尝试（你是你的文件）

sort -n -t\| -k2 -k1 < u |
awk -F\| '$1 < 8000 { a[$2]++ ; print } 
          $1 >= 8000 { if ( !a[$2] && ( !e[$2] || e[$2]<$8 ))  {u[$2]=$0;e[$2]=$8;} ; } 
          END { for ( i in u ) print u[i] ;}'

给出

4000|1234||||||23
5000|1234||||||40
15000|456||||||29
9000|123||||||22

在哪里

-t\|并-F\|指示 sort 和 awk 用作|分隔符
-k2 -k1：按第二个字段排序，然后按第一个字段排序
|排序行中应该是行中的最后一个字符
$1 < 8000 { a[$2]++ ; print }如果低于 8000，则打印行并记住 2 美元的值
$1 >= 8000 { ... }如果高于，则存储最高值
END { for ( i in u ) print u[i] ;}退出时转储所有值
您可能需要重新排序。
第 2 行条件可以简化（通过将 if 条件置于 {} 之外）
您的测试中的某些行有 9 个字段。

请注意，该命令可以是一行

... | sort -n -t\| -k2 -k1  | awk -F\| '...'

Answer 1

尝试（你是你的文件）

sort -n -t\| -k2 -k1 < u |
awk -F\| '$1 < 8000 { a[$2]++ ; print } 
          $1 >= 8000 { if ( !a[$2] && ( !e[$2] || e[$2]<$8 ))  {u[$2]=$0;e[$2]=$8;} ; } 
          END { for ( i in u ) print u[i] ;}'

给出

4000|1234||||||23
5000|1234||||||40
15000|456||||||29
9000|123||||||22

在哪里

-t\|并-F\|指示 sort 和 awk 用作|分隔符
-k2 -k1：按第二个字段排序，然后按第一个字段排序
|排序行中应该是行中的最后一个字符
$1 < 8000 { a[$2]++ ; print }如果低于 8000，则打印行并记住 2 美元的值
$1 >= 8000 { ... }如果高于，则存储最高值
END { for ( i in u ) print u[i] ;}退出时转储所有值
您可能需要重新排序。
第 2 行条件可以简化（通过将 if 条件置于 {} 之外）
您的测试中的某些行有 9 个字段。

请注意，该命令可以是一行

... | sort -n -t\| -k2 -k1  | awk -F\| '...'

需要使用 awk 基于具有多对一关系的两列来过滤数据

答案1

相关内容