我在安装了全新硬件的全新 Server 2008 R2 x64 服务器上遇到了一个非常奇怪的问题。我甚至退换了主板和 CPU,以为它们可能有缺陷。问题仍然存在
- Windows Server 2008 R2 x64 带有 SP1,并且应用了所有 Windows 更新。
- 华硕 P8H67-PRO H67 芯片组,带 Core i5 2500K(使用英特尔高清显卡和 win7 x64 驱动程序)
- 2x4GB Corsair 内存
- 最新 MB Bios (1002)
- Hyper-V 未启用
- 已启用桌面体验
- OCZ Vertex2 2.5 英寸 SSD 160 GB(可能相关?)
行为:
服务器将保持通电状态,但没有视频,基本上是锁定状态。无网络(ping 无响应),键盘灯对大写或数字锁定无响应。就好像机器关闭了一样,尽管机箱中的风扇仍在旋转。
这种情况随机发生。与负载、热量、正常运行时间、应用程序使用情况无关。事实上,这种情况发生在服务器空闲时。前一分钟还好,一两个小时后我再次查看显示器时,屏幕变黑,必须手动关闭/打开电源。通常情况下,当我早上检查服务器时,肯定会在夜间发生,但在特定时间后不会发生。
C:\Windows\minidump 文件夹中没有任何内容,也没有内核转储。我在显示器前只目睹过一次死机。它只是黑屏,就像电源设置启动并切断显示器的视频一样……除了移动鼠标和敲击键盘无法唤醒它,而且它再次无法通过网络访问。
完全没有错误可以参考,也没有办法触发或强制重现该问题。不知道如何修复它。
我需要想法,一些不明显的东西。
更新
看这个:http://www.gskill.us/forum/showthread.php?t=8390
似乎是华硕 P8H67 的问题 这个可怜的家伙认为是他的内存问题,因为他在 gskill.us 论坛上发帖。我理解他的痛苦。
我必须考虑其他 MB 制造商。MSI 或 Gigabyte 都可以(虽然我听说 MSI 也有 EFI bios,gigabyte 是某种混合产品)。
注意:我有一台 Shuttle SH67H3,它是 H67 芯片组,我有相同的 Corsair 内存和相同的 Core i5 2500k CPU...OCZ SSD,没有问题。这肯定是华硕 H67 主板的问题。
答案1
我在域控制器上遇到了同样的问题,它会忘记自己是谁并开始出现故障,但降级它解决了这个问题。使用 LiveCD 检查,它似乎是硬件。如何为 LiveCD 安装一个数据文件夹来保存 /var/log/ 或将其配置为输出到中央服务器。
如果机器配置为将错误检查输出到串行端口,则 VGA 可能会关闭,并且您看不到 BSOD?它是否配置为保存转储?
这是在安全模式下发生的吗?
答案2
就像我之前说的,我遇到了同样的问题,但自从我从 Server 2008 R2 切换到 Ubuntu Server 后,我就再也没有遇到过任何问题。有可能这种情况还会发生,但我当然希望不会。我认为导致问题(对我来说)的是 Windows 7 x64 驱动程序,尤其是华硕网站上的 USB 3.0 驱动程序,甚至在安装过程中也导致了一些问题。我尝试重新安装 Server 2008 R2 并从英特尔网站获取所有驱动程序,这些驱动程序被标记为适用于 Server 2008 R2。花了一段时间才找到它们,但除了 USB 3.0 之外,我找到了所有驱动程序。我开了整整两天,它没有崩溃。之后,出于各种原因,我仍然决定使用 Ubuntu Server。由于您也在使用 Windows 7 驱动程序,所以这可能值得一试,也就是说,如果您还没有切换主板的话。我不知道为什么它会在使用 Ubuntu Live CD 时崩溃,也许我们遇到的并不是同样的问题……或者也许我只是到目前为止很幸运:) 无论如何,我认为 Windows 7 驱动程序是罪魁祸首。