我们刚刚经历了一场雷暴导致的停电。停电时间很长,足以重新启动服务器和交换机。我们在同一个池中运行 2 个 XenServer 虚拟机管理程序。起初,它们似乎都运行正常。它们都使用相同的交换机连接到 Equallogic SAN。
然后我意识到其中一个正在不断在 /var/log 中发送 iscsi 错误。
消息
Jul 20 23:27:29 hkixen01 kernel: [ 1266.132897] connection1:0: detected conn error (1020)
Jul 20 23:27:30 hkixen01 iscsid: Kernel reported iSCSI connection 1:0 error (1020) state (3)
Jul 20 23:27:32 hkixen01 kernel: [ 1269.232077] connection1:0: detected conn error (1020)
Jul 20 23:27:33 hkixen01 iscsid: Login authentication failed with target iqn.2001-05.com.equallogic:0-1cb196-559bd552f-84749b57a93535a3-xen
Jul 20 23:27:34 hkixen01 iscsid: connection1:0 is operational after recovery (1 attempts)
SM日志
Jul 20 20:55:47 hkixen01 SM: [7935] ***** generic exception: vdi_deactivate: EXCEPTION SR.SROSError, The VDI is not available [opterr=LV scan error]
当我在出现错误的虚拟机管理程序上启动虚拟机时,虚拟机性能选项卡上的 CPU 使用率达到 100%。虚拟机在启动时卡住,即使等待几个小时后也没有响应。目前,我们根本无法使用有问题的虚拟机管理程序来托管任何虚拟机。可能是什么问题?其他虚拟机管理程序似乎根本没有问题。
答案1
严重崩溃(断电)后,发生这种情况并不罕见。
您应该首先确定 XenServer 是否连接到 SR,然后确定 VDI 的健康状况。
连接/配置 http://support.citrix.com/article/ctx118841
VDI不可用 http://support.citrix.com/article/CTX131201和/文章/CTX138234
答案2
问题已解决。我们的一个交换机端口出现故障,导致巨型数据包无法传送。较小的数据包可以正常传送,这使得问题很难被发现。