系统:Windows Server 2016 Standard,主机和客户机均已完全修补。
今天,当我重新启动我的一台 Hyper-V 客户机时(通过 RDP 连接到客户机并手动触发重新启动),发生了一件奇怪的事情。以下是事件日志的相关部分:
客人:
11:38:32 The operating system is shutting down at system time 2020-07-09T09:38:32.812302400Z.
11:41:00 The operating system started at system time 2020-07-09T09:40:59.495420000Z.
主持人:
11:40:39 The operating system started at system time 2020-07-09T09:40:38.490643100Z.
11:40:39 The last shutdown's success status was false. The last boot's success status was true.
11:40:51 The previous system shutdown at 11:38:05 on 09.07.2020 was unexpected.
11:40:42 The system has rebooted without cleanly shutting down first. This error could be caused if the system stopped responding, crashed, or lost power unexpectedly.
(BugcheckCode 0, BugcheckParameter1 0x0, ...)
它出现客户机成功重启,在客户机关闭的短暂时间内,主机决定关闭电源,这看起来……很奇怪。主机和客户机的时钟完全同步。
这是一个已知问题还是某些硬件故障的征兆?如果是后者,欢迎对原因(SSD、RAM 或系统板)进行有根据的猜测。
一些额外的背景信息(不知道这是否相关,为了以防万一我还是把它包括进去):主机每隔几个月就会出现 BSOD(!),Bugcheck 代码指向有故障的硬件(虽然我还不能通过检查小型转储来确定罪魁祸首,堆栈跟踪中没有设备驱动程序或其他明显的线索)。上次(两个月前)我切换了 RAM 芯片的顺序,从那以后就再也没有出现过 BSOD。由于这些 BSOD 很少发生,因此几乎不可能用通常的技术来调试它们(例如,我不能用一半的 RAM 运行主机半年只是为了看看是否能解决问题)。Memtest86 没有报告错误,但我知道这并不一定意味着 RAM 完全没问题。这是带有 ECC RAM 的 HP Microserver Gen10。