在awk中计算排名？

Question

rankR 中函数在多重情况下的默认行为k似乎是对下一个进行平均kk-1排名（在此过程中使用额外的排名）：

$ awk '
    FNR == NR {numbers[$1]++; next}
    FNR == 1 {
        n = asorti(numbers, sorted, "@ind_num_asc")
        for (i=1; i<=n; i++) {
            k = numbers[sorted[i]]; 
            rank[sorted[i]] = i + offset + (k-1)/2; 
            offset += (k-1)
        }
    }
    {print rank[$1]}
' file file
6
2
1
3.5
5
3.5

请注意，numbers[$1]=1已更改为来numbers[$1]++记录多重性。

Answer 1

rankR 中函数在多重情况下的默认行为k似乎是对下一个进行平均kk-1排名（在此过程中使用额外的排名）：

$ awk '
    FNR == NR {numbers[$1]++; next}
    FNR == 1 {
        n = asorti(numbers, sorted, "@ind_num_asc")
        for (i=1; i<=n; i++) {
            k = numbers[sorted[i]]; 
            rank[sorted[i]] = i + offset + (k-1)/2; 
            offset += (k-1)
        }
    }
    {print rank[$1]}
' file file
6
2
1
3.5
5
3.5

请注意，numbers[$1]=1已更改为来numbers[$1]++记录多重性。

在awk中计算排名？

答案1

相关内容