我的一台文件服务器出现了随机挂起/锁定问题。它运行的是 Windows 2003 SP2(32 位),内存为 3 GB,安装了截至 2011 年 9 月的所有补丁。硬件是 Vmware ESXi 4.1,iSCSI 到 CX3 SAN,有 3 个 1.95TB LUN。我们每个月都会重启以安装补丁。该服务器是 4 年前建造的,这个问题在 3 个月前开始出现。
现在的问题是,大约每月一次,服务器会挂断,无法通过 RDP 进入服务器,可以连接到共享,但我无法保存或打开文件。从 VI 客户端,您可以看到服务器,但是当您打开控制台时,您会看到默认的蓝屏(不是 BSOD),并且永远不会看到登录框。我已经等了 60 分钟才恢复,但什么都没有。从 VI 客户端重置服务器并关闭服务器,正常重启,一切又恢复正常。查看事件查看器,我收到的唯一错误是事件 ID 333:
Event Type: Error
Event Source: Application Popup
Event Category: None
Event ID: 333
Date: 9/19/2011
Time: 2:34:17 PM
User: N/A
Computer: server name
Description:
An I/O operation initiated by the Registry failed unrecoverably. The Registry could not read in, or write out, or flush, one of the files that contain the system's image of the Registry.
For more information, see Help and Support Center at http://go.microsoft.com/fwlink/events.asp.
Data:
0000: 00 00 00 00 01 00 6c 00 ......l.
0008: 00 00 00 00 4d 01 00 c0 ....M..À
0010: 00 00 00 00 4d 01 00 c0 ....M..À
0018: 00 00 00 00 00 00 00 00 ........
0020: 00 00 00 00 00 00 00 00 ........
我可以在哪里查找错误?我可以运行任何软件来获取额外的日志记录?由于计划在年底完成的一个大项目,我目前无法重建服务器。
答案1
除了 ESXi 4.1 现在已经非常旧(虽然这篇文章是 2011 年 9 月发表的)之外,请尝试以下操作:
“我还对所有磁盘(OS .vmdk 文件和共享映射的原始 lun)仅使用 1 个 SCSI 控制器。一旦测试完成,我会告诉你它是否也解决了我的问题。
我现在有 2 个 SCSI 控制器:SCSI 控制器 0 用于 OS .vmdk,SCSI 总线共享设置为无。SCSI 控制器 1 用于所有映射的原始 lun,SCSI 总线共享设置为物理”
答案2
正如 GregD 提到的,另外还有很多其他的事情要看...本质上可能是当你不需要它时 /3gb、高 i/o、混乱的驱动程序或应用程序(Symantec NAV 很常见)...
这里有许多关于人们如何解决这个问题的不同例子活动ID