大家好。有人能帮我解决以下问题吗?任何指点或帮助我都会很感激!
我有一个包含 +500,000 行的数据集子集,如下所示
|— Group —|— Name —|— Value1 —|— Value2 —|
在每个组中,我正在尝试识别价值 1 的前 5 和前 10 个百分点中的名称,这样我就可以继续计算每个已识别百分位数的值 2 的总和。
到目前为止,我已经能够创建一个如下所示的数据透视表。
|----------|--Sum Val1--|--Sum Val2--|
|--GroupA--|----------| Totals for GroupA
|----------|-Name A1--| Values.......
|----------|-Name A2--| Values.......
...
|----------|-Name An--| Values.......
|--GroupB--|----------| Totals for GroupB
... Values.......
|--GroupZ--|----------| Totals for GroupZ
我可以手动识别百分位数,但我想还有更简单的方法。我搜索了几次如何进行,但我只遇到了在整个数据集中查找百分位数的过程。