我有一台 Windows 2003 服务器,在过去两周内挂起两次 - 第二次是在启动不到 2 小时后。事件查看器中没有任何内容表明有任何故障。对于没有磁盘错误的这种冻结,我怀疑我的服务器硬件存在某种故障。
我的服务器是半通用的 1U Supermicro,配有 Adaptec RAID 1 控制器。我在 RAID 1 中运行两个 SATA 500gb 驱动器。
我有一个较旧但功能齐全的戴尔服务器机箱,目前没有使用;但是我不认为它具有相同的 Adaptec RAID 控制器。(我实际上并不确定,但目前我假设没有。)我试图弄清楚是否可以从故障硬件中取出磁盘并将 Win 2003 服务器重新启动到戴尔硬件上。
这分为两个子问题:
1) 如果我使用 RAID 1 组的磁盘,是否有办法在戴尔服务器上启动该磁盘(假设戴尔服务器没有 RAID)?
2) Windows Server 对硬件有多挑剔?它会检测到变化并在不同的硬件上成功启动吗?
还有什么我应该注意的吗?
答案1
您将遇到的主要问题是磁盘控制器,如果您的新硬件具有不同的磁盘控制器,则当您尝试启动时 Windows 很可能会出现蓝屏。
如果您的磁盘配置在 RAID 阵列中,那么您将无法将它们移动到新硬件,因为配置数据都存储在您的 RAID 控制器上。
总而言之,这可能是一个坏主意,你最好使用某种映像软件来获取磁盘映像并将其移动到新硬件。
答案2
这对您来说是一个危险的举动,但如果您不担心丢失数据,请继续阅读......
这就是硬件 RAID 的祸根。一旦您使用驱动器,您就会想坚持使用连接到它的任何硬件卡。断开驱动器的连接并将它们推入 JBOD 样式是一种冒险的做法,而且可能有效也可能无效,这取决于 RAID 控制器如何处理磁盘布局。有些控制器会将信息“写入”磁盘,这基本上会从一开始就破坏您的想法,而其他控制器会将所有内容存储在电池支持的 CMOS 中,并真正将其视为纯镜像。
这两个系统之间的关系有多密切?它们是否具有(大致)相同的主板芯片组?Windows 对于移动到不同的视频卡、NIC、驱动器适配器等相当宽容,但它往往不喜欢被交换到具有完全不同的北桥/南桥的主板。
我的答案是警示“是的”,前提是 (a) 您的 RAID 控制器没有将奇怪的内容写入磁盘,并且 (b) 您查看了驱动程序的差异,并准备通过提供缺少的驱动程序软件使其正常工作。听起来很傻,但在移动磁盘之前尝试安装驱动程序。最初启动到“安全模式”可能是尝试此操作的最佳选择。请记住,一旦您破坏了该镜像,使驱动器同步可能会导致某些数据丢失情况(我曾见过混乱的 RAID 控制器在您重新加入镜像时将“旧”驱动器同步到“新”驱动器,从而导致数据丢失)。
我的个人建议?
我会安排一些停机时间,然后继续:
- 使用数据真空吸尘器对电路板和组件进行吸尘,或者如果你不能这样做,可以使用压缩气体(不推荐,但作为最后的手段)清除电路板上的灰尘
- 检查 CPU 和其他组件上的散热器是否有灰尘堵塞。这些风扇在长时间吸入大量灰尘方面表现出色,而散热器则是绝佳的灰尘收集器。一些较小机箱上的现代“CPU 烟囱”使问题更加严重,将您的计算机变成昂贵的吸尘器。
- 使用手电筒检查主板是否有损坏、盖子膨胀或烧坏或其他问题。烧坏、烧坏或卡住的组件将导致计算机以不合格的方式运行年。
- 采取适当的 ESD 预防措施,重新安装所有插槽中的卡和 RAM。随着时间的推移,组件会因热应力而膨胀和冷却,在极少数情况下,CPU 外壳的制造公差较差或质量低劣会导致扭曲,从而将卡从插槽中拉出。我见过 PCI 网卡在寒冷的制造环境中“拉”出来,也见过 RAM 无法完全就位并最终从插槽中摇晃出来。
- 确保电源也清洁/吹干,并且连接到电源的所有风扇都在工作,或者,如果是被动系统,则在关闭设备电源之前,确保空气流过它们。
- 如果这是使用售后零件的低端或白盒设备,您可能希望重新润滑 CPU 和散热器。我见过旧的导热膏在插座下形成热点,导致 CPU 间歇性冻结。一旦涂抹新的导热膏,问题就消失了。 对此要小心。 如果是中高档设备,糊剂通常是供应商提供的特定“粘性物质垫”,您将无法执行此过程。 如果有疑问,请不要这样做。
答案3
您可以尝试将磁盘放入戴尔机器,但如果您的目标是一台稳定、正常工作的计算机,那么您最好在戴尔机器上从头开始安装,或者放弃 SuperMicro 机器上的硬件 RAID 控制器,然后使用 JBOD 配置从头开始重建并使用 Windows 软件 RAID。
我知道这不是你想听到的,但这是正确的做法。
我尝试使用至少一个 Adaptec SATA RAID 控制器执行此操作,并收到 BOOT_DEVICE_INACCESSIBLE STOP 消息。我不记得该确切告诉您哪种型号。
重建盒子--您希望它是稳定的。