我有 2 个数据集:
其中一个看起来像:
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
3
3
另一个看起来像:
1
3
3
1
1
3
1
1
1
1
1
1
2
2
2
2
2
2
3
3
3
3
3
3
2
3
2
1
1
3
1
1
1
1
1
1
2
2
2
2
2
2
3
3
3
3
3
3
1
1
3
2
这个想法是,第一组变化很小,它实际上只变化两次,所以我想说它变化很小。
第二组的变化比第一组大得多。两者最终可能包含相同数量的 1、2 和 3,但重要的是顺序。
方差的问题在于它不考虑顺序,因此两组可能具有相同的方差。如果您愿意的话,我正在尝试测量数据集中的噪音。例如,一组随机的 1、2 和 3 基本上 100% 是嘈杂的。只有 1 的列表则完全没有噪音。
它不必完美,我只是想用 Excel 以某种方式客观地测量数据的噪声程度。
答案1
在没有考虑实际统计数据的情况下,我会执行以下操作。
作为数组公式输入的公式Ctrl+Shift+回车
=SUM(ABS(A3:A5-A2:A4))
它会计算 abs(A2-A1)+abs(A3-A2)+abs(A4-A3)... 依此类推,只要你的范围是。
也可以使用平均值或任何您想要的函数,但它应该可以让您对噪音有所了解。
答案2
1 2 3
A 1
B 2
C 2
D 3
- 在单元格 B2 中,放置
=IF(A2=A1,0,1)
- 在单元格 B3 中,放置
=IF(A2=A3,0,1)
- 把它们拉下来
结果如下:
1 2 3
A 1
B 2 1 0
C 2 0 1
D 3 1 0
第 2 列将计算移位,而第 3 列将计算重复值。
在底部,将第 2 列和第 3 列相加,然后将 3 除以 2。这将得出方差的度量(变化数/重复数,在本例中 = 1/2 = 50% 重复和 50% 变化)