数据列内范围的最大值、平均值、最小值

Question 1

单程：

sort -k4n,4 file | awk '$2>=43808877 && $2<=43808882{tot+=$4;cnt++;max=$4;min=cnt==1?$4:min}END{print min, max,tot/cnt}'

首先，我们将sort文件放在第 4 列，以便第一个记录具有最小值，最后一个记录具有最大值。使用awk，我们对范围内的数字求和并打印统计数据

Answer

单程：

sort -k4n,4 file | awk '$2>=43808877 && $2<=43808882{tot+=$4;cnt++;max=$4;min=cnt==1?$4:min}END{print min, max,tot/cnt}'

首先，我们将sort文件放在第 4 列，以便第一个记录具有最小值，最后一个记录具有最大值。使用awk，我们对范围内的数字求和并打印统计数据

Question 2

如果您不喜欢 awk，那么 Miller 很适合这种事情：

mlr --nidx --repifs filter '$2 >= 43808877 && $2 <= 43808882' then stats1 -f 4 -a max,min,mean file

Answer

如果您不喜欢 awk，那么 Miller 很适合这种事情：

mlr --nidx --repifs filter '$2 >= 43808877 && $2 <= 43808882' then stats1 -f 4 -a max,min,mean file

Question 3

$ cat tst.awk
$2>=43808877 && $2<=43808882 {
    cnt++
    sum += $4
    min = ( (cnt == 1) || ($4 < min) ? $4 : min )
    max = ( (cnt == 1) || ($4 > max) ? $4 : max )
}
END {
    print max+0
    print min+0
    print (cnt ? sum / cnt : 0)
}

$ awk -f tst.awk file
14
3
8.83333

请注意 END 部分中的保护，以确保您始终获得数字输出，并且即使在所需范围内没有记录，也不会出现被零除错误。

Answer

$ cat tst.awk
$2>=43808877 && $2<=43808882 {
    cnt++
    sum += $4
    min = ( (cnt == 1) || ($4 < min) ? $4 : min )
    max = ( (cnt == 1) || ($4 > max) ? $4 : max )
}
END {
    print max+0
    print min+0
    print (cnt ? sum / cnt : 0)
}

$ awk -f tst.awk file
14
3
8.83333

请注意 END 部分中的保护，以确保您始终获得数字输出，并且即使在所需范围内没有记录，也不会出现被零除错误。

Question 4

精简版本。

$ awk '/43808877/,/43808882/{t+=$4;c++;if($4>x){x=$4}if($4<n||!length(n)){n=$4}}END{print x,n,t/c}' f
14 3 8.83333
$

Answer

精简版本。

$ awk '/43808877/,/43808882/{t+=$4;c++;if($4>x){x=$4}if($4<n||!length(n)){n=$4}}END{print x,n,t/c}' f
14 3 8.83333
$

数据列内范围的最大值、平均值、最小值

答案1

答案2

答案3

答案4

相关内容