首先使用 awk 处理最后一行

Question 1

如果您的数据源是一个可以多次读取的文件（即它不是流），您应该首先使用tail(1)从最后一行获取您想要的数据，并将其传递给 awk 以对其进行顺序处理。tail将查找文件末尾以读取最后一行，而无需读取其之前的所有数据。

awk -v norm=$(tail -n 1 file | cut -d' ' -f2) '{print $1, $2/norm}' file

对于整个文件无法放入缓冲区缓存的大文件来说，这将是一个巨大的胜利（这意味着需要从磁盘读取两次，每次传递一次），并且无需扫描，将在较小程度上有所帮助输入到达最后一行。较小的文件可能与两遍方法没有太大区别。

Answer

如果您的数据源是一个可以多次读取的文件（即它不是流），您应该首先使用tail(1)从最后一行获取您想要的数据，并将其传递给 awk 以对其进行顺序处理。tail将查找文件末尾以读取最后一行，而无需读取其之前的所有数据。

awk -v norm=$(tail -n 1 file | cut -d' ' -f2) '{print $1, $2/norm}' file

对于整个文件无法放入缓冲区缓存的大文件来说，这将是一个巨大的胜利（这意味着需要从磁盘读取两次，每次传递一次），并且无需扫描，将在较小程度上有所帮助输入到达最后一行。较小的文件可能与两遍方法没有太大区别。

Question 2

您可以在 awk 中将其作为两遍解决方案：

awk 'FNR == NR { n = $2; next } { print $1, $2/n }' infile infile

如果您的 awk 版本支持 ENDFILE 块（例如 GNU awk 4+），您可以这样做：

awk 'ENDFILE { n = $2 } FNR != NR { print $1, $2/n }' infile infile

seek请注意，先到文件末尾查看效率更高卡姆的回答。

解释

第一个示例的工作原理是记住前面的$2，即仅当本地行计数器 ( FNR) 等于全局行计数器 ( NR) 时才对其进行计算。该next命令跳到下一行，在这种情况下，它确保仅在解析第二个参数时才评估最后一个块。

第二个示例具有类似的逻辑，但利用了 ENDFILE 块，该块在到达输入文件末尾时进行评估。

Answer