我有一列有近一百万行,值的范围从 25 到 140000(大约),尽管并非这个范围内的每个值都存在。我怎样才能得到一个显示值分布的图表(可能是钟形图),最好只显示实际存在的值?
答案1
输入数据透视表。
突出显示数据插入数据透视表。
使用列标签 = 数据 使用值的数据计数
然后根据数据透视表结果创建图表。
答案2
如果你想要一个显示分布情况的图表,包括不存在的值的差距,你可能需要使用 Excel 的频率公式。这需要两个参数,您正在分析的数据数组和一个 bin 数组(用于计算这些值的唯一实例)。对于 bin 参数,您可以使用单个值(1、2、3...n)或组值(5、10、15...n)的数组。在 25-140,000 的范围内,值大于 1 的 bin 可能更可取,否则您最终会得到一个包含 140,000 列的图表,并且间隙(或其他异常)将很难看到。
一旦您有了频率数组,只需将值绘制为柱形图,您就会得到类似于分布直方图的东西。
注意:频率是一个数组公式,因此您需要选择要填充的单元格范围,然后按 [Ctrl]-[Shift]-[Enter] 完成。
编辑: 这是使用您提到的数据参数的示例图表。它使用随机值,因此分布相对均匀,但它显示了值的密度。
还值得注意的是,Excel 在计算上并没有出现太多问题——图表格式的刷新稍微延迟了,但它可以相当好地处理数据量。