我将从我想要解决的最紧迫的问题开始,然后在下面解释 XY 问题,以防有帮助,或者以防我以一种愚蠢的方式解决它。
我在 Excel 中有一个这样的表格:
车 | -2 | -1 | 0 |
---|---|---|---|
大众高尔夫 2013 | 20000 | 30000 | 40000 |
大众高尔夫 2016 | 23000 | 60000 | 70000 |
大众 Polo 2008 | 67000 | 34000 | 39000 |
日产逍客 2020 | 50000 | 120000 | 80000 |
日产 Micra 2018 | 40000 | 70000 | 9000 |
想象一下,“0”、“-1”和“-2”分别代表“最近”、“第二最近”和“第三最近”——假设这是一张二手车经销商销售的汽车表。表中的数字是汽车出售时的行驶里程值。
对于这种情况,我想做的是将最近三种车型的里程值绘制成线图。我真的不知道如何正确解释这一点,所以我将绘制一个图表并希望说明这一点。
我希望数字 -2 -1 0 位于 X 轴上,里程位于 Y 轴上(因此这里显示的最高里程为 120,000)。
到目前为止我已经尝试过:
- 在 Excel 中创建如下所示的表格,减去“汽车”标题:
- 选择表格,点击插入->折线图
- 点击“选择数据”
- 点击“切换行列”,得到X轴上的“时间值”。
但是,我不知道如何在 Y 轴上获取我想要的数字。相反,发生的情况是这样的:
如何生成一个图表,将所有车型作为折线图中的单独线条捕获,其中 X 轴显示“时间值”(-2、-1、0),Y 轴显示里程(表格中的数值?)
XY问题
所以我开始使用的数据实际上看起来像这样(无论如何,在我真正的解决方案的模型中)......
已购买 | 制作 | 模型 | 年 | 里程 |
---|---|---|---|---|
2023-02-14 | 大众 | 高尔夫球 | 2013 | 20000 |
2023-02-11 | 大众 | 高尔夫球 | 2013 | 30000 |
2023-01-28 | 大众 | 高尔夫球 | 2013 | 40000 |
2023-02-25 | 大众 | 高尔夫球 | 2016 | 23000 |
2023-01-03 | 大众 | 高尔夫球 | 2016 | 60000 |
2023-01-01 | 大众 | 高尔夫球 | 2016 | 70000 |
2023-02-23 | 大众 | 马球 | 2008 | 67000 |
2023-01-20 | 大众 | 马球 | 2008 | 34000 |
2022-12-28 | 大众 | 马球 | 2008 | 39000 |
2023-02-24 | 日产 | 逍客 | 2020 | 50000 |
2023-02-15 | 日产 | 逍客 | 2020 | 120000 |
2023-02-10 | 日产 | 逍客 | 2020 | 80000 |
2023-02-23 | 日产 | 米克拉 | 2018 | 40000 |
2023-02-12 | 日产 | 米克拉 | 2018 | 70000 |
2023-02-01 | 日产 | 米克拉 | 2018 | 9000 |
我决定做的第一件事是转换这些数据,将三个“分组”列(品牌、型号和年份)连接成一个字符串,因为我认为这会更容易处理。然后我将日期转换为“最近值”,因为我实际上并不关心实际日期是什么。我只想显示哪辆车是“最近”售出的,其中最近为 0,任何小于 0 的日期为 -1、-2 等。我将它们作为列标题并转置了里程数据,因为我认为这会更容易绘制图表,但我仍然无法获得我想要的可视化效果。
因此,如果有一种方法可以从原始数据集中实际获取我想要的折线图,而不是转换数据,那就太好了。
提前致谢!