下图是图表上显示144 measurements
的图。Column A
我决定让所有值都更接近4300
中间的,这样我就可以展示优化前后的效果。现在唯一的目的是为了展示一个视觉示例,而不是数学示例。但后来我决定应该使用Solver optimization
Microsoft Excel 以数字方式进行操作,下面是我操作的方式:在中column B
我假设它=ABS(SUM(B1;-4300))
应用于整个Column B
,并且D2
是中所有值的总和Column B
。现在我作为第一次试验的优化问题是将D2
其最小化为某个值,例如15000
其中规划求解将修改中的值Column A
以达到此目标,并且我还将收到Column A
更接近的新值4300
。
在第二张图片中您可以看到结果。
我的问题在于:虽然我成功地将数据最小化到某个值,但我真正需要解决的是,有些值比其他值“更远”,因此它们“不值得”与更近的值一样接近4300
。我们可以将其视为远值的较高惩罚因子,而近值的较低惩罚因子。我应该如何以及在哪里引入这个惩罚因子?
答案1
线性映射关系会移动数据的平均值,但不会影响其离散度(或标准差)。
如果想让数据根据其与平均值的距离而以不同的方式移动,则需要定义映射关系。
例如,您可以使用线性变换:新值 = 新平均值 + (旧值 - 旧平均值) * 因子当因子为 1.0 时,数据会移动而不会改变离散度。当因子小于 1(但大于 0)时,数据会更接近平均值,但原本远离平均值的数据会移动得更多。
如果数据具有正态分布的特征(我无法判断,因为您没有发布工作簿),那么您可能首先要确定 Z 统计量,该统计量用于测量数据与平均值之间的标准差:Z =(旧值 - 旧平均值)/旧标准差
然后,您可以使用该 Z 统计量来确定具有新平均值和新标准差的新值(仍然遵循正态分布)。要执行此重新映射,您可以使用上一个公式的逆:=新平均值 + Z*新标准差
通过使用上面描述的Z统计量和逆映射关系,新数据保留了其正态分布,只是有了新的平均值和标准差。它还保留了与原始数据的联系。