在我的 Excel 2016 工作表中,我有大量数据(~224 000 行/5 列),格式如下:
参数 1 | 参数 2 | 参数 3 | 参数 4 | 结果 | -------------------------------------------------------------------------------- 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 2 | 0 | 0 | 1 | 0 | 3 | 0 | 0 | 0 | 1 | 4 | 1 | 1 | 0 | 0 | 5 | [...]
该格式类似于“二进制”字,其中每个列中的每个值都经过测试,每个值在“结果”列中都产生不同的结果。
有没有什么方法可以创建一个图表(曲线或散点图),以便能够看到这 4 个参数中的哪一个使“结果”增长得更快?
我尝试选择 5 列来创建图表,但结果却是“凹陷”曲线。即使一次只使用一个参数作为“结果”,也会出现凹陷曲线,因为数据是“参数 x”列,从 0 到 n,并在 200k+ 行中多次重置。
编辑
下面是我使用 XY Graph 得到的一个例子:
Y轴是“结果”中的值,X轴是行号。
该图中的结果列为黄色。
编辑2
结果类似于以下公式:
结果 = (常量 + 参数 1) * (1 + 参数 2 / 100) * (1 + 参数 3 / 100 * 参数 4 / 100)
答案1
前期准备(如果您想直奔主题,请跳过此部分):
Serenity,我尝试重现您的图表,以检查我是否正确理解了您的问题,并且能够“接近”。有两个主要区别:
- 您的图表显示结果和参数 3 在 x 值约为 55,000 时“重置”。但您说参数 3 从 0 变为 100(以 1 为增量),然后重复。您还说 x 轴是行号。这些说法是矛盾的,除非行号与 Excel 中的整数系列(即行号)截然不同。
- 你的图表才不是显示参数 1,您说它从 0 到 61,增量为 1,然后重复。但您的图表 做显示从大约 30 开始并在所示范围内跳跃增加的一系列(灰色符号)。
因此,以下分析将大致向您展示如何进行,但结论适用于我从您的评论中生成的数据,而不适用于图表中显示的数据。
重要事项(如果你想直奔主题,就从这里开始):
在下面的图表中,我绘制了结果,以及由移除计算得出的四个参数之一。这些参数分别标记为 P123、P124、P134 和 P234 - 它们是通过分别删除参数 4、3、2 和 1 生成的。
对于参数 2、3 和 4,我从方程中删除了整个项(即 (1+Param2/100)。对于乘以常数的参数 1,我删除了只是参数 1。您可以决定以不同的方式处理此问题。另请注意,我使用 300 作为常数,因为这会为结果提供 75 的初始值,这与您的图表所示值大致相同。
下图显示了结果和四个 Pnnn 系列,每个系列都拟合了一条线性趋势线。这张图有点乱,但有一点很清楚:删除参数 4增加趋势线的斜率。例如,P123“增长”得比结果快,这意味着参数4有一个消极的对结果增长的贡献——它会减少结果增长。
下一个图表扩展了第一个图表的下部,并包括线性拟合方程。(P123 超出比例,但最上面的方程是其趋势线)。
结果趋势线的斜率为 0.0584。P234、P134 和 P124 的斜率都较低,这意味着缺失的参数对增长都有积极影响 - 将它们添加回来会使斜率增加到 0.0584。斜率最低的是 P124。这意味着参数3对Result的增长影响最大。
正如我上面所说,如果你对现有数据应用这种分析,你可能会发现不同的结果。
但我希望这会有所帮助,祝你好运。
注意:要向系列添加趋势线(在 Excel 2011 for Mac 中),请单击系列中的某个点,然后从“图形”菜单中选择“添加趋势线...”。在出现的对话框中,在“类型”下选择“线性拟合”,在“选项”下选中“在图表上显示方程式”复选框。具体细节可能因 Excel 版本而异。
编辑:我想指出,这个函数的“增长”有点误导。因为所有四个参数都是循环函数,从长远来看,它们的斜率都是零。结果仅在具有最长周期(P3)的参数的初始周期中“增长”。但是,当 x 的值足够大时,结果将趋于平稳,线性拟合的斜率将接近零。为了证明这一点,您可以对 P3 的 n 个周期进行线性拟合,并看到斜率随着 n 的增加而减小。