我想创建一个散点图,其中每个数据点根据列中的值而不同(不同的图标、不同的颜色等)。
我正在学习分类模型,我想在 Excel 中制作一个散点图,(1)在 x 和 y 轴上映射两个独立变量,(2)根据第三个独立变量更改数据点。
示例:我有一张包含三列的表格:错误(电子邮件中的拼写错误)、收件人(电子邮件“收件人”部分中的收件人数量)和垃圾邮件(1 表示垃圾邮件,2 表示非垃圾邮件)。它看起来像这样:
Errors, Recipients, Spam
20,200,1
18,175,1
32,100,1
15,123,1
2,10,0
5,8,0
9,27,0
15,20,1
15,20,0
8,300,0
9,357,1
一目了然,错误率较高的消息和收件人数量多的邮件更有可能是垃圾邮件。错误率低且收件人少的邮件很可能不是垃圾邮件。收件人数量高和低的邮件更难预测。我想用散点图来展示这一点。
我可以制作一个散点图,Y 轴表示错误,X 轴表示收件人。我还需要做的是根据垃圾邮件单元格是 1 还是 0,将每个数据点更改为“+”或“-”。
我知道可以更改所有数据点的外观,也可以手动更改单个数据点。但是,是否可以根据列值自动、有条件地更改数据点的外观?
答案1
Excel 没有图表的条件格式(虽然它确实应该有)。实现此目的的最佳方法是:
1) 将数据转换为 Excel 表格(每次都应该这样做)。2
) 添加两个辅助列,+ 和 -。3
) 将此公式添加到辅助列
+=IF([@[ Spam]]=1,[@[ Recipients]],NA())
-=IF([@[ Spam]]=0,[@[ Recipients]],NA())
4) 使用 Y 数据的 + 和 - 列创建图表。
此外,您还需要考虑如何处理重叠点(例如 15,20)。您可以在选择数据对话框中调整绘图顺序,或者考虑处理重叠的不同符号系统(例如 + 和 x)。