使用已知平均值计算标准差

Question 1

首先，请注意示例中的第 2 列不是样本表示文件中的数据。如果这是正确的平均值真的分布，则标准差为：

$ awk '{ssq+=($1 - $2)**2} END { print sqrt(ssq / NR); }' file1a
61.4138

这里，变量ssq是与真实平均值的偏差的平方和。

上述程序实现了标准差的公式：

其中 mu (μ）是个真的意思是。

我所说的真的平均值有时被称为人口平均值，意味着如果理论上拥有整个总体，而不仅仅是该总体的某些样本，则可以计算出的平均值。

Answer

首先，请注意示例中的第 2 列不是样本表示文件中的数据。如果这是正确的平均值真的分布，则标准差为：

$ awk '{ssq+=($1 - $2)**2} END { print sqrt(ssq / NR); }' file1a
61.4138

这里，变量ssq是与真实平均值的偏差的平方和。

上述程序实现了标准差的公式：

其中 mu (μ）是个真的意思是。

我所说的真的平均值有时被称为人口平均值，意味着如果理论上拥有整个总体，而不仅仅是该总体的某些样本，则可以计算出的平均值。

Question 2

对于此类问题，请看一下datamash：

datamash -W pstdev 1 < file1

在许多其他功能之间，在 datamash 中，您有一个

Answer

对于此类问题，请看一下datamash：

datamash -W pstdev 1 < file1

在许多其他功能之间，在 datamash 中，您有一个

相关内容