Excel 2010 中的数据分布

Excel 2010 中的数据分布

我有一列有近一百万行,值的范围从 25 到 140000(大约),尽管并非这个范围内的每个值都存在。我怎样才能得到一个显示值分布的图表(可能是钟形图),最好只显示实际存在的值?

答案1

输入数据透视表。

突出显示数据插入数据透视表。

使用列标签 = 数据 使用值的数据计数
然后根据数据透视表结果创建图表。

答案2

如果你想要一个显示分布情况的图表,包括不存在的值的差距,你可能需要使用 Excel 的频率公式。这需要两个参数,您正在分析的数据数组和一个 bin 数组(用于计算这些值的唯一实例)。对于 bin 参数,您可以使用单个值(1、2、3...n)或组值(5、10、15...n)的数组。在 25-140,000 的范围内,值大于 1 的 bin 可能更可取,否则您最终会得到一个包含 140,000 列的图表,并且间隙(或其他异常)将很难看到。

一旦您有了频率数组,只需将值绘制为柱形图,您就会得到类似于分布直方图的东西。

注意:频率是一个数组公式,因此您需要选择要填充的单元格范围,然后按 [Ctrl]-[Shift]-[Enter] 完成。

编辑: 这是使用您提到的数据参数的示例图表。它使用随机值,因此分布相对均匀,但它显示了值的密度。频率图

还值得注意的是,Excel 在计算上并没有出现太多问题——图表格式的刷新稍微延迟了,但它可以相当好地处理数据量。

相关内容