Linux 服务器死机 - 需要帮助和选项

Linux 服务器死机 - 需要帮助和选项

我有一台 Dell PE 1950,带有 2 个 SATA 驱动器,组成软件 RAID1。操作系统是 CentOS 5.5 (2.6.18.x)。今天下午开始,我们收到硬件错误(总线上有东西坏了,E171F),机器变得没有响应。我们硬启动,它恢复了大约 5 小时,但后来又发生了这种情况。

我正在尝试找出我们的选择。不幸的是,我们没有类似的硬件,但我有一台可以使用的小型台式机。我考虑将其中一个驱动器放入台式机,然后启动它。我的目标是使用 Vmware 转换器对其进行 P2V,但显然免费的 v5.x 不支持 RAID 卷上的热克隆/转换,只有 Enterprise 4.x 版本的 Converter 才支持。

我的问题是:

  1. 将 RAID1 对中的单个驱动器放入另一块硬件是否安全?根据我的研究和理解,似乎是安全的,但需要确认。
  2. 有没有什么方法可以解决 Vmware Converter 在热克隆/转换会话期间不支持 RAID 卷的问题?
  3. 我还忽略了其他选择吗?

答案1

您可以尝试寻找类似的服务器。Dell PowerEdge 1950 系统很常见,在城市或大都市地区找到类似的硬件应该不成问题。

你遇到的错误是PCIe 总线错误. 戴尔的指示是:

移除并重新安装 PCI 扩展卡。如果问题仍然存在,请参阅扩展卡故障排除。如果问题仍然存在,则转接卡或系统板有故障。

这些都是可修复和可维护的组件,因此联系当地资源来获取零件可能更有意义。有人有库存!首先尝试修复来源问题。我认为移动驱动器或尝试 P2V 可能会有点麻烦。

如果系统运行时间足够长,你可以简单地复制关键数据。但这绝不是一个无法修复的情况。

相关内容