如何保留模式匹配的最高编号的行？

Question 1

我没有 osxawk来尝试这个，但它可以在我的 linux gnu awk 上运行：

awk '
{ n = match($0, /[0-9]+ *$/);
  if(n){
    word = substr($0, 1, n - 1); num = 0 + substr($0, n);
    if(!(word in max) || max[word] < num) max[word] = num
  }
}
END{ for(word in max)print word max[word] } '

在每一行上，我们在正则表达式模式的行中查找起始索引，该索引是带有可选尾随空格的数字。我们将该索引处的行拆分为单词部分和数字部分。通过向数字字符串添加 0 将其转换为数字。由单词索引的关联数组保存最大的数字。

Answer

我没有 osxawk来尝试这个，但它可以在我的 linux gnu awk 上运行：

awk '
{ n = match($0, /[0-9]+ *$/);
  if(n){
    word = substr($0, 1, n - 1); num = 0 + substr($0, n);
    if(!(word in max) || max[word] < num) max[word] = num
  }
}
END{ for(word in max)print word max[word] } '

在每一行上，我们在正则表达式模式的行中查找起始索引，该索引是带有可选尾随空格的数字。我们将该索引处的行拆分为单词部分和数字部分。通过向数字字符串添加 0 将其转换为数字。由单词索引的关联数组保存最大的数字。

Question 2

如果与给定前缀相对应的行总是分组的（即所有行都stringNNN在一起等），则可以使用 awk，缓冲具有相同前缀的行，然后打印出具有最高后缀的行。

awk '{
    match($0, /[0-9]*/);
    current_prefix = substr($0, 1, RSTART);
    current_number = substr($0, RSTART, RLENGTH);
    if (current_prefix == previous_prefix) {
        if (current_number > max_number) max_number = current_number;
    } else {
        if (NR != 1) print previous_prefix max_number;
        previous_prefix = current_prefix;
        max_number = current_number;
    }
}
END { if (NR != 1) print previous_prefix max_number; }'

如果与给定前缀对应的行并不总是分组（例如，您可以有foo1 bar1 foo2），您可以先对文件进行排序。

Answer

如果与给定前缀相对应的行总是分组的（即所有行都stringNNN在一起等），则可以使用 awk，缓冲具有相同前缀的行，然后打印出具有最高后缀的行。

awk '{
    match($0, /[0-9]*/);
    current_prefix = substr($0, 1, RSTART);
    current_number = substr($0, RSTART, RLENGTH);
    if (current_prefix == previous_prefix) {
        if (current_number > max_number) max_number = current_number;
    } else {
        if (NR != 1) print previous_prefix max_number;
        previous_prefix = current_prefix;
        max_number = current_number;
    }
}
END { if (NR != 1) print previous_prefix max_number; }'

如果与给定前缀对应的行并不总是分组（例如，您可以有foo1 bar1 foo2），您可以先对文件进行排序。

如何保留模式匹配的最高编号的行？

答案1

答案2

相关内容