我在 Xen 3.x 中运行 Windows Server 2003 客户机实例。此 DomU 运行良好一两天后,就停止响应 — 我没有收到任何网络响应,也无法再连接到此 DomU 的 Xen VNC 控制台。
xm list
显示如下:
Name ID Mem VCPUs State Time(s)
Domain-0 0 6508 8 r----- 1161159.4
[A working Linux DomU] 1 512 1 -b---- 68711.1
[The hung Windows DomU] 5 512 1 ------ 67234.2
[Another working Linux DomU] 3 512 1 -b---- 163036.4
(这是什么------
意思?xm 手册解释了六种状态各自的含义,但没有解释无状态的含义。
如果我xm destroy
再次启动xm create
Windows DomU,它会立即重新启动(出现 Windows 警报The previous system shutdown at [...] was unexpected.
),然后在一两天后停止响应。除了该警报之外,Windows 事件日志中没有任何相关信息。此外,我正在使用 Munin 来监控磁盘、网络、进程数、CPU 使用率和内存使用率;Munin 图表未显示挂起前的任何资源耗尽或其他可疑活动。
我检查过/var/log/xen/*.log
,但服务器停止响应时没有生成任何日志消息。
我该如何着手解决这个问题?
答案1
意思------
是它处于无状态。例如,它没有运行、被阻止、暂停、关闭、崩溃或死亡。因此,“可运行但未运行”,就好像它在运行队列中,但不在队列的前面。
至于故障排除,到目前为止您尝试过什么,您正在运行哪些 Xen 性能监控工具或脚本?当我们不知道您去过哪里时,很难建议去哪里。如果您还没有这样做,我肯定会从日志记录和性能监控开始,看看您是否可以将可运行状态的开始与任何指标相关联。
查看 Windows 事件日志或在 Windows 内部进行一些性能日志记录也许也是值得的 - 我怀疑他们会说出任何值得注意的内容,但可能是客户操作系统内部的某些东西触发了这种行为,如果是这样,你应该查看客户操作系统来追踪是什么。