简介/问题
大家好,
我已经陷入困境了。
我有一台运行 Windows Server 2003 的 Dell R300 服务器。它昨晚深夜崩溃了,当我尝试重新启动它时,我收到有关安装的 PERC 5e RAID 控制器的以下错误。
1)在Windows登录屏幕:
Controller event log: BBU disabled, changing WB virtual disks to WT: Controller 0 (PERC 5/E Adapter)
2)在R300服务器前面:
E171F PCIE FATAL ERR B0 D4 F0
我们尝试将 RAID 控制器重新放置在同一个 PCIE 插槽中,但没有任何变化。
然后,我们尝试将其切换到另一个 PCIe 插槽,但在启动时它根本找不到控制器配置,因此我们将其移回原来的插槽。
我启动了 PERC Config BIOS,发现可能有可用的固件更新。RAID 控制器信息如下:
控制器信息
PERC 5/E
软件包 5.2.1-0066
固件版本 1.03.40-8316
BIOS 版本 MT28-8
注意事项
我认为这可能是一个坏的 RAID 控制器,我可能需要备份并将配置导入到另一个控制器,但我愿意接受任何建议。
我是否可以进行进一步的诊断/故障排除尝试,以使此 PERC 5/e 重新上线,或者您认为此控制器已损坏?
是否值得尝试启动 Dell OpenManage Assistant CD 并查看是否有其他可用选项?我认为我没有现成的此软件,因此如果可以的话我可能需要下载并刻录它。
假设该控制器坏了,在另一台服务器/控制器上备份和恢复此配置的步骤是什么?
请原谅我的无知,因为我对这种级别的故障排除没有太多经验。
谢谢你的时间,
亚伦
答案1
所以正如您所说它仍然启动到 Windows 登录屏幕我假设除了您发布的错误消息之外服务器运行正常?
控制器事件日志:BBU 已禁用,将 WB 虚拟磁盘更改为 WT:控制器 0(PERC 5/E 适配器)
基本上,此错误消息仅告诉您 RAID 控制器的电池已损坏/已耗尽/不存在,因此您的虚拟磁盘缓存模式设置为回写到直写。这背后的原因是您的控制器缓存不再由 BBU 支持,因此在断电的情况下将其用于写入缓存是不安全的。
目前唯一可能出现的问题是写入性能略有下降。
通常,PERC5 在启动时也会发出哔哔声,我确信我记得它们还有一个表示电池电量不足的特殊错误消息,这让我认为在您的情况下:
- 与 BBU 的连接不知何故断开了(您可以尝试重新连接),
- 或者您的电池已经完全没电了,控制器甚至无法再识别它。
最后不用担心 - 从另一台服务器拉出一个可以工作的 BBU/控制器或者在 ebay 上买一个。
对于任何控制器来说,BBU 电池没电都是一个很常见的问题(锂离子电池会随着时间推移而磨损),这也是为什么现在大多数 RAID 控制器都使用基于闪存的缓存而不是 BBU 的原因。
关于如何更换控制器(如果需要的话)。PERC5 确实将卷配置存储在磁盘本身上。当您更换控制器时,它只会显示所有驱动器“外国的”. RAID BIOS 内部有一个菜单“外部配置”它允许您从驱动器导入配置。我认为这个过程非常完美。