Xen 上的 Windows Server 2003 客户机经常停止响应

Xen 上的 Windows Server 2003 客户机经常停止响应

我在 Xen 3.x 中运行 Windows Server 2003 客户机实例。此 DomU 运行良好一两天后,就停止响应 — 我没有收到任何网络响应,也无法再连接到此 DomU 的 Xen VNC 控制台。

xm list显示如下:

Name                                        ID   Mem VCPUs      State   Time(s)
Domain-0                                     0  6508     8     r----- 1161159.4
[A working Linux DomU]                       1   512     1     -b----  68711.1
[The hung Windows DomU]                      5   512     1     ------  67234.2
[Another working Linux DomU]                 3   512     1     -b---- 163036.4

(这是什么------意思?xm 手册解释了六种状态各自的含义,但没有解释无状态的含义。

如果我xm destroy再次启动xm createWindows DomU,它会立即重新启动(出现 Windows 警报The previous system shutdown at [...] was unexpected.),然后在一两天后停止响应。除了该警报之外,Windows 事件日志中没有任何相关信息。此外,我正在使用 Munin 来监控磁盘、网络、进程数、CPU 使用率和内存使用率;Munin 图表未显示挂起前的任何资源耗尽或其他可疑活动。

我检查过/var/log/xen/*.log,但服务器停止响应时没有生成任何日志消息。

我该如何着手解决这个问题?

答案1

意思------是它处于无状态。例如,它没有运行、被阻止、暂停、关闭、崩溃或死亡。因此,“可运行但未运行”,就好像它在运行队列中,但不在队列的前面。

至于故障排除,到目前为止您尝试过什么,您正在运行哪些 Xen 性能监控工具或脚本?当我们不知道您去过哪里时,很难建议去哪里。如果您还没有这样做,我肯定会从日志记录和性能监控开始,看看您是否可以将可运行状态的开始与任何指标相关联。

查看 Windows 事件日志或在 Windows 内部进行一些性能日志记录也许也是值得的 - 我怀疑他们会说出任何值得注意的内容,但可能是客户操作系统内部的某些东西触发了这种行为,如果是这样,你应该查看客户操作系统来追踪是什么。

相关内容