大约每个月,我的一台运行 VMware 4.1 的服务器就会变得无响应。恢复它的唯一方法是进行硬重启。发生这种情况时,我可以连接到 VMware,但除了导航和查看信息外无法执行任何操作。
服务器是 Dell PowerEdge R210,配有两个 1TB SATA 磁盘和 Dell SAS 6/iR 适配器 Raid 控制器(镜像磁盘,无电池)。我有另一台相同的服务器,运行正常。
我现在已经更换了服务器,以便进行一些测试来解决这个问题。到目前为止,我已经:更新了 BIOS 和 Raid 控制器固件,重新安装了 VMware,更换了所有 RAM 模块,但这并不能解决问题。
我尝试在服务器上安装 Ubuntu,但问题并不存在,只有在运行 VMware 时才会出现这个问题。
这种情况已发生过大约 10 次,并且看起来在磁盘负载较大的情况下更有可能发生。
错误信息如下:
与存储设备 naa.600508e000000000a528c060b1275b09 失去连接。路径 vmhba1:C1:T0:L0 已关闭。受影响的数据存储区:“”、“datastore1”、“Hypervisor1”、“Hypervisor2”、“Hypervisor3”。
由于连接问题,无法访问卷 50520233-c467e816-a5a1-0026b97a4010 (datastore1)。恢复尝试正在进行中,结果将很快报告。
以下是日志条目: