我正在为公司做一些社交媒体报告,想看看 Twitter 帖子的统计分布。因变量是参与率(定义为 %),各种自变量可能是一天中的小时、一周中的天、使用的标签数量等。
我有一个 Excel 导出文件,里面有我所有的推文,每条推文占一行,每列显示变量。我在让箱线图正常运行方面取得了好坏参半的成功。我需要重新格式化我的数据吗?如果需要,该怎么做?如果不需要,我做错了什么?
例如,我的数据可能如下所示:
HOUR OF DAY ENGAGEMENT %
08 1.02
17 0.98
12 1.88
但箱线图却不是这样 :( Twitter 每日一小时图片
我可以编写一个用于表示星期几的版本,但是这需要我手动重新排序前几行,以使 x 轴与周一、周二、周三等对齐。
DAY ENGAGEMENT %
Thu 0.89
Mon 2.02
Tue 1.69
etc.
任何帮助将不胜感激!