我有很多数据必须分析,但有些数据是错误的。这给我绘制数据透视图和表格带来了问题。如果没有错误,图表应该如下所示:
但事实并非如此。这是我得到的结果:
当然,错误的字段不止这些。总共我有超过30 万行正确与否。我不知道有多少是错的。
更新一:我获得的数据是 5 年内每 5 分钟采集一次的。有时可能第 5 分钟没有数据,但第 6分钟或第 4分钟有数据。那么必须过滤掉这些错误。
更新二:下面是来自我的数据透视表的一些虚假数据,您可以看到删除线是错误的:
╔═══════════╦════════╗ ║ 时间 ║ 千瓦时 ║ ╠═══════════╬═════════╣ ║ 07:40:15 ║ 32,65 ║ ║ 07:45:25 ║ 40,83 ║║ 07:46:05 ║ 0,00 ║║ 07:50:57 ║ 50,38 ║ ║ 07:55:14 ║ 55,71 ║║ 07:56:20 ║ 0,00 ║║ 08:00:14 ║ 60,72 ║ ║ 08:05:25 ║ 61,42 ║ ║ 08:10:54 ║ 70,78 ║ ║ 08:15:10 ║ 80,75 ║║ 08:16:01 ║ 0,00 ║║ 08:20:25 ║ 85,06 ║ ║ 08:25:02 ║ 85,46 ║ ║ 08:30:10 ║ 100,73 ║ ║ 08:35:25 ║ 100,21 ║║ 08:37:10 ║ 0,00 ║║ 08:40:47 ║ 115,60 ║ ║ 08:45:45 ║ 120,16 ║ ║ 08:50:01 ║ 128,77 ║ ║ 08:55:25 ║ 140,75 ║ ╚═══════════╩═════════╝
背景信息:这些信息是关于太阳能电池板及其每 5 分钟产生的千瓦时电量。
我的问题现在:
- 我怎样才能从 Excel 2013 版本中的数据透视表和数据透视图中过滤掉上述错误数据?
- 我能计算出错误了百分之多少吗?
答案1
您需要插入一个新列,然后检查数据是否正常:
=MOD(MINUTE(A2),5)=0
如果数据正确,则返回 TRUE;如果数据错误,则返回 FALSE。只需在数据透视图中对其进行过滤即可。
如果您想计算错误和正确的数据,在数据透视表中也很容易。
更新
过滤掉错误的值
插入新列后,只需使用以下设置在数据上插入数据透视图:
- 报告过滤器:“正确”,将其设置为
TRUE
- 轴字段:“时间”
- 值:“kWh”的平均值(总和结果相同)
- 将图表类型更改为“折线图”
计算错误值和正确值
在数据透视表集中:
- 列标签以“更正”
- 在“值字段设置”中将值改为“时间”的计数 - “显示值为”选择“总计的百分比”
笔记
从网站获取数据时,我的 excel 无法自动识别为时间,我不得不使用TIMEVALUE()
第一个屏幕截图中的函数;不过,最好的方法是将原始列转换为时间(如果它是文本)