根据子组,按百分位数对观察结果进行排序?

根据子组,按百分位数对观察结果进行排序?

我有一个电子表格,其中有一列是公司名称的数据,另一列是公司的员工人数,还有一列按 SIC 代码对公司进行分类,如下所示:

Company    Employees     SIC Code
A              5          2011
B              10         2011
C              15         7374
D              11         7374
E              77         6733
F              44         6733

(这只是一个简化版本;我有几个 SIC 代码和数千个公司观察值)。基本上,我想要做的是根据公司员工人数的百分位数对每组 SIC 代码进行分类。例如,对于 SIC 代码 2011,我想找出哪些公司的员工人数超过 99 百分位数;对于 SIC 代码 6733 也是如此(依此类推)。按组获取观察值的百分位数似乎很简单,但我遇到了麻烦。任何帮助都将不胜感激。

答案1

我会使用 Power Query 插件来实现这一点。它具有强大的数据处理命令。它下面有各种功能,但只需单击 Power Query 窗口中的按钮即可实现很多功能。

我尝试了这个特殊的挑战并成功了。您可以从我的 OneDrive 下载并使用我的演示文件:

http://1drv.ms/1AzPAZp

它是文件:Power Query 演示 - 组内的百分位数.xlsx

正如自述表上所述,我只需要编写 2 个简单的函数 - 其余部分则通过单击 UI 来构建。

相关内容