什么原因可能导致 RAID 10 的所有 HDD 同时崩溃?

什么原因可能导致 RAID 10 的所有 HDD 同时崩溃?

我经历了一个灾难性的周末;我正在运行一个带有一些虚拟化(KVM)的服务器;每个服务器托管大约 100 个用户。全天负载为 0.40-0.89,机器有 128GB RAM。

好吧:星期六服务器不再可用。我立即使用 IPMI-Access,简直不敢相信我看到的:RAID 完全降级。只有 2 个硬盘“还活着”,但上面没有数据。

在我被告知崩溃前大约一小时,我看到有一个Proxmox-Backup 正在运行。但这真的是导致所有崩溃的原因吗HDD

我不太清楚我应该怎么做才能防止这种情况发生......

答案1

但这真的是导致所有硬盘崩溃的原因吗?

这似乎不太可能,但可以检查一下普罗克斯莫克斯也许 ?

我不太清楚我应该怎么做才能防止这种情况发生......

为了防止这种情况再次发生,您需要了解其发生的原因。

为此,您需要利用您(或其他人)的系统管理员工具包来解决问题并进行一些根本原因分析。

我发现好老科学的方法是实现这一目标的完美工具。

以下是一些我之前准备的问答这应该有帮助。

我想,在您的情况下,阅读您的日志以获取相关信息是一个很好的开始。

相关内容