添加/删除节点时计算集群整体可用性的工具/公式

添加/删除节点时计算集群整体可用性的工具/公式

我正在尝试寻找当应用程序在集群上运行且应用程序不具备容错能力时计算整体系统可用性的常用方法。即如果集群中的任何一个节点发生故障,应用程序就会失败。

当从 1 线性递增时,我总是可以乘以。例如,从 1 个节点到 2 个节点,如果每个节点的评级为 99.99%,则得到的 2 节点集群大约为 99.98(暂时忽略连接性)。后续添加节点只是简单的数学运算(我认为)。

那么从 256 个节点到 320 个节点怎么样?或者从 256 个节点到 128 个节点?肯定有比根据单个节点的评级从 1 到 x 计算数字更好的方法吧?这很容易做到,但希望有人有更好的方法。

谢谢。

答案1

如果所有系统具有相同的可靠性,则总可靠性很容易计算: 单个节点的可靠性乘以R=r^n节点数。rn

因此,如果节点数为 250,则准确率约为 97.5%,如果节点数为 320,则准确率约为 96.85%

如果不一样,则为 R=∏r i其中 (i=1..n),这在 Excel 中仍然很容易计算。

相关内容