我们的一个文件服务器不断出现操作系统磁盘阵列延迟写入失败的情况。该服务器使用板载 RAID 卡构建在 Raid1 阵列上。
到目前为止,我已经通过从机器中取出并进行全盘检查来验证两个硬盘都没有问题。(显然不是同时进行的)当只有一个磁盘存在时,写入失败仍然会发生,并且不是在服务器中完成检查磁盘。
我该如何检查它是否确实是 RAID 卡的问题,或者我所做的工作是否足以安全地说明它是卡的问题?请记住,故障卡意味着需要更换主板。
谢谢
答案1
据我所知,您唯一没有做的事情就是在疑似坏卡上换上新磁盘。不要对您关心的数据进行此操作,但将真实数据克隆到几个备用磁盘(在另一台机器上,然后检查以找到坏的备用磁盘)可能是合理的。(您确实有备用磁盘,对吗?)
这里的假设是,问题的再次出现表明不是磁盘故障。
答案2
首先,您应该更新控制器的驱动程序和固件,并阅读已知问题/发行说明。根据您的操作系统和系统,您可以做不同的事情。
答案3
验证您使用的磁盘是否受相关服务器支持。
有时使用第三方磁盘会导致奇怪的问题,因为行为略有不同或驱动器不支持 RAID 卡所需的 ioctl。