情况如下:我运行的是 CentOS 5.7 x86_64,带有 Xen 3.0.3(xen-3.0.3-132.el5_7.2.x86_64)和 Xen 内核(2.6.18-274.12.1.el5xen)。该服务器有 8GB RAM 和 i7-950 @ 3.07Ghz。我用它来托管两个客户机 - Windows Server 2008 R2 和 CentOS 6.2 x86_64 - 两者都使用全虚拟化和 LVM 分区。
在过去一周左右的时间里,这台服务器每天崩溃 5-10 次,有时在上次启动后几分钟就崩溃了。机器没有任何变化,也没有安装任何新软件(我之前使用此内核/Xen 版本大约 3-4 周,没有出现任何问题)。
机器运行正常,然后就停止了 - 控制台上没有任何内容,日志中也没有任何内容(我看不到)。必须通过关闭电源然后再次打开来重新启动,有时几分钟内就会再次发生这种情况。一周多前进行了一次完整的硬件检查,一切都恢复正常。使用 e2fsck 确实解决了几个问题,但实际上并没有解决问题(如果有的话,它现在似乎更频繁地崩溃了)。
昨晚我启动了一张实时 CD 来运行 e2fsck,它运行良好,大约 8 小时,没有任何崩溃(在驱动器上安装 CentOS 的情况下,它可能不会崩溃)。这听起来越来越像是一个软件问题,但很难确定,因为没有更改任何配置,也没有安装任何新软件。
我检查了所有系统日志,似乎没有什么异常。我还使用 e2fsck 对每个分区进行了全面检查。我已将 pastebinned 日志链接在下面,但我就是搞不清楚。
/var/log/消息:http://pastebin.com/CNkf73sN
/var/log/dmesg:http://pastebin.com/r2Hx9uij
任何帮助都将不胜感激。提前致谢。