我的服务器好像被诅咒了。每隔 2-5 天它就会出现故障 (我对这个东西还很陌生)
我花了几周左右的时间尝试寻找解决方案。但显然一无所获。我发现的任何关于 PSOD 的引用都与更旧的版本有关,直接由机器上运行的 VM、HP iLO 驱动程序或其他似乎与我的问题不相关的情况引起。
我无法从 wall-o-text 中获得任何有用的信息,除了有关 vCenter Server 代理的一些信息以及可能有关我的 10g NIC 的信息?(我已经将其删除,以防万一)
这里这是几张照片。
我应该有更多,但我显然没有保存它们?
目前正在使用的硬件
- 主板 =超微 X9DRI-FO
- CPU = 2x至强E5-2670
- 内存 = 32GB
- HBA = 2xSAS9211-8I
- 电源=700瓦
我迄今为止尝试过的硬件
- 3块主板
- 超微 X9DRI-FO
- 英特尔至尊 dz77ga-70k
- 英特尔台式机主板 DX58SO
- 2 组 CPU(一组双插槽 CPU 和一组单插槽 CPU)
- 至强E5-2670
- Xeon X5650(这可能不是合适的 CPU,但它目前被埋没
- 3 个电源
- 550 瓦
- 700 瓦
- 850 瓦
- 2组测试RAM(一组ECC)
- 32GB DDR3 ECC
- 16GB DDR3
- 2 个安装设备(一个旋转锈迹,一个 USB)
我尝试过的其他方法
- 重新安装
- 重新下载安装媒体并从不同的(相同的)USB 驱动器重新安装
- 没有运行虚拟机
我有点吝啬了机壳,所以我对背板不是很有信心。我也试过更换托架。然后直接连接到主板上的 SATA 连接
服务器位于UPS,因此电力异常不应该成为问题。
我 99% 肯定我忽略了一些显而易见的东西,但把脸撞到墙上一段时间后,就开始变得难以看清了。幸运的是,无论如何我都需要开始发布问题来获得声誉。
答案1
当然,如果可能的话,你应该使用受支持的硬件。还有针对不同供应商(如 HPE 或 Dell)的驱动程序集。因此,这可能只是驱动程序问题。
另一件我不明白的事情是,如果您已经重新安装了 ESXi,为什么还要使用 Build 4564106?
当前版本号为 7388607。我不知道整个补丁历史,但我认为使用带有最新错误修复的最新版本不会是坏事……