Dell Openmanage 8.2 和服务器 2008 R2 64 位出现异常行为且 RAID 性能下降

Dell Openmanage 8.2 和服务器 2008 R2 64 位出现异常行为且 RAID 性能下降

由于 AD 数据库已损坏且无法修复,我最近不得不重建域控制器 [DC02]。此外,由于硬盘故障,此服务器的 RAID [RAID 1] 已降级。我不得不在 DC02 上重新安装操作系统,因为 DC01 必须夺取驻留在 DC02 上的角色。我还清理了 DC01 上的元数据。长话短说......将 DC02 提升为域控制器后,一切都运行正常。这就是奇怪的行为开始的地方。计算机重新启动后,它会复制并正常连接到 DC01,但大约 10 分钟后,它会断开与网络的连接,然后就消失了。你无法 ping 它或做任何事情。我运行了所有 dcdiag 测试、repadmin 测试等......没有任何东西指向我的原因。

经过一个多星期的故障排除,我发现罪魁祸首是 Dell Openmanage [OM],它会在 [10 分钟时] 引发降级 RAID 事件并断开服务器与网络的连接。当我卸载 Dell OM 时,一切都运行正常,没有中断。我尝试编辑 Openmanage 实用程序中的 [警报] 设置,但这似乎并没有改变行为……服务器总是在 10 分钟后断开连接。您可以看到在服务器与网络断开连接之前触发的事件。

以前有人见过这种情况吗?有没有一种解决方法可以让我在 RAID 降级时使用 OM?RAID 硬盘最终将被更换,但由于我从事政府承包商项目,因此可能需要数周甚至数月才能获得替换硬盘,而且我希望获得额外的冗余层,即使它只是 DC02 上的一个驱动器。

我想使用 Openmanage,因为它可以方便地监控服务器硬件统计数据、日志和警报。虽然我已经找到了原因,但我想发布此信息,以防有人遇到这种情况而无法弄清楚。我在网上搜索线索或问题解决方案非常困难,但没有成功。我找到的大多数信息都与 DNS 问题等有关。

我现在正在检查组策略,看是否有某些东西触发了此行为[注意:此服务器最初由其他人设置,您猜对了,它不再可用。][更新:在组策略中找不到任何似乎触发此行为的东西]。

相关内容