我在 100tb.com 有 3 台服务器使用 Softlayer 的数据中心。
其中两个是 RAID 1。其中至少两个已经连续工作了一年多,并且整天都在磁盘上写入大量数据。因此,磁盘的工作量很大。
我想知道当一些磁盘发生故障时会发生什么。我知道即使有一个磁盘不工作,服务器仍会继续工作。
我想知道的是,我如何知道其中一个磁盘出现故障?
答案1
您应该安装监控软件来检查系统的 RAID 状态。
它是软件 RAID 还是硬件 RAID?哪个控制器?
Windows、Linux 还是哪种操作系统?
也许已经安装(并运行?)了监控软件,可以配置它来检查您的 RAID 状态。
我用网管系统进行这些检查(以及更多),但还有许多其他监控程序。请参阅您使用什么工具来监控您的服务器?。
是的,磁盘阵列是安全的!总是想要在服务器上安装 RAID!这就是想法,如果磁盘发生故障,则有冗余。如果您没有 RAID,那么您的系统就会因磁盘故障而崩溃。
答案2
Softlayer 在其所有盒子上都使用 Adaptec 控制器,并且在所有盒子上安装 arcconf 软件。
您可以以 root 身份运行此程序来检查有关控制器和磁盘的所有信息:
/usr/StorMan/arcconf GETCONFIG 1
如果您只是想知道任何问题,请检查“逻辑设备状态”行。它将显示“最佳”或“降级”。
答案3
根据您的控制器,您应该能够从每个硬盘查询智能数据