计算 RAID 重建期间不可恢复读取错误的概率的公式

Question 1

这是最好的答案，也包含概率理论：

http://evadman.blogspot.com/2010/08/raid-array-failure-probabilities.html?showComment=1337533818123#c7465506102422346169

Answer

这是最好的答案，也包含概率理论：

http://evadman.blogspot.com/2010/08/raid-array-failure-probabilities.html?showComment=1337533818123#c7465506102422346169

Question 2

有许多网站和文章试图解决这个问题。

这地点有 RAID 0、5、10/50/60 级别的计算器。

维基百科文章RAID 级别其中有关于 RAID 0 和 RAID 1 故障率的部分。

RAID 0：

给定 RAID 0 组的可靠性等于每个磁盘的平均可靠性除以组中的磁盘数量：

也就是说，可靠性（以平均故障时间 (MTTF) 或平均故障间隔时间 (MTBF) 衡量）大致与成员数量成反比 – 因此一组两个磁盘的可靠性大约是单个磁盘的一半。如果磁盘在三年内发生故障的概率为 5%，那么在两个磁盘阵列中，该概率将增加到 {P}（至少一个发生故障） = 1 - {P}（两个均未发生故障） = 1 - (1 - 0.05)^2 = 0.0975 = 9.75%。

RAID 1：

举一个简单的例子，假设一个 RAID 1 有两个相同型号的磁盘驱动器，每个磁盘在三年内发生故障的概率为 5%。假设故障在统计上是独立的，那么两个磁盘在三年使用寿命内发生故障的概率为 0.25%。因此，如果不对阵列进行任何操作，三年内丢失所有数据的概率为 0.25%。

我还发现了一些关于这个主题的博客文章，包括这个这提醒我们系统中的独立驱动器（RAID中的I）可能毕竟不是那么独立：

简单的理论是，如果硬盘 1 发生故障的概率为 1/1000，硬盘 2 也发生故障的概率为 1/1,000,000，那么两者同时发生故障的概率就是 1/1,000,000。该理论假设故障在统计上是独立的，但事实并非如此。除非故障之间不相关，否则不能这样乘以概率。错误地假设独立性是应用概率时常见的错误，也许是最常见的错误。

Joel Spolsky 在最新的 StackOverflow 播客中就此问题发表了评论。当一家公司构建 RAID 时，他们可能会同时使用四五个从装配线上下来的磁盘。如果其中一个磁盘有轻微缺陷，导致其在使用 10,000 小时后发生故障，则很可能所有磁盘都会发生故障。这不仅仅是理论上的可能性。公司已经观察到一批磁盘大约在同一时间全部发生故障。

Answer

有许多网站和文章试图解决这个问题。

这地点有 RAID 0、5、10/50/60 级别的计算器。

维基百科文章RAID 级别其中有关于 RAID 0 和 RAID 1 故障率的部分。

RAID 0：

给定 RAID 0 组的可靠性等于每个磁盘的平均可靠性除以组中的磁盘数量：

也就是说，可靠性（以平均故障时间 (MTTF) 或平均故障间隔时间 (MTBF) 衡量）大致与成员数量成反比 – 因此一组两个磁盘的可靠性大约是单个磁盘的一半。如果磁盘在三年内发生故障的概率为 5%，那么在两个磁盘阵列中，该概率将增加到 {P}（至少一个发生故障） = 1 - {P}（两个均未发生故障） = 1 - (1 - 0.05)^2 = 0.0975 = 9.75%。

RAID 1：

举一个简单的例子，假设一个 RAID 1 有两个相同型号的磁盘驱动器，每个磁盘在三年内发生故障的概率为 5%。假设故障在统计上是独立的，那么两个磁盘在三年使用寿命内发生故障的概率为 0.25%。因此，如果不对阵列进行任何操作，三年内丢失所有数据的概率为 0.25%。

我还发现了一些关于这个主题的博客文章，包括这个这提醒我们系统中的独立驱动器（RAID中的I）可能毕竟不是那么独立：

简单的理论是，如果硬盘 1 发生故障的概率为 1/1000，硬盘 2 也发生故障的概率为 1/1,000,000，那么两者同时发生故障的概率就是 1/1,000,000。该理论假设故障在统计上是独立的，但事实并非如此。除非故障之间不相关，否则不能这样乘以概率。错误地假设独立性是应用概率时常见的错误，也许是最常见的错误。

Joel Spolsky 在最新的 StackOverflow 播客中就此问题发表了评论。当一家公司构建 RAID 时，他们可能会同时使用四五个从装配线上下来的磁盘。如果其中一个磁盘有轻微缺陷，导致其在使用 10,000 小时后发生故障，则很可能所有磁盘都会发生故障。这不仅仅是理论上的可能性。公司已经观察到一批磁盘大约在同一时间全部发生故障。

计算 RAID 重建期间不可恢复读取错误的概率的公式

答案1

答案2

相关内容