我正在为多个 Linux DomU 使用基于 Xen 硬件的虚拟化。当其他 DomU 的 I/O 负载很重时,其中一个 DomU 会随机出现 I/O 错误并失败。
dmesg
包含以下内容
[885434.196928] sd 0:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT,SUGGEST_OK
[885434.196934] end_request: I/O error, dev sda, sector 1557062
[885434.246997] Aborting journal on device dm-1.
[885438.713821] __journal_remove_journal_head: freeing b_committed_data
[885438.728478] ext3_abort called.
[885438.728698] EXT3-fs error (device dm-1): ext3_journal_start_sb: Detected aborted journal
[885438.729192] Remounting filesystem read-only
这是来自不同事件的第二个输出:
[1532214.100163] sd 0:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT,SUGGEST_OK
[1532214.100169] end_request: I/O error, dev sda, sector 3751150
[1532214.100172] Buffer I/O error on device dm-1, logical block 275514
[1532214.100442] lost page write due to I/O error on dm-1
[1547950.515890] sd 0:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT,SUGGEST_OK
[1547950.515896] end_request: I/O error, dev sda, sector 5477734
[1547950.515900] Buffer I/O error on device dm-1, logical block 491337
[1547950.516358] lost page write due to I/O error on dm-1
[1547972.401281] Aborting journal on device dm-1.
[1547950.541130] ext3_abort called.
[1547950.541357] EXT3-fs error (device dm-1): ext3_journal_start_sb: Detected aborted journal
[1547950.541869] Remounting filesystem read-only
[1547950.542125] EXT3-fs error (device dm-1) in ext3_ordered_write_end: IO failure
每次崩溃时扇区都会有所不同,如果我从 Dom0 检查磁盘(位于 md1 中),则找不到任何错误。
在安装 VMWare 工具之前,我在使用基于 VMWare ESX 的虚拟化时遇到了同样的问题,因此我预计是驱动程序问题,因为没有包含特殊驱动程序的“Xen 工具”(如 VMWare 工具),我不知道如何解决这个问题。
DomU 使用Linux 2.6.24-24-server #1 SMP Tue Aug 18 16:51:43 UTC 2009 x86_64 GNU/Linux
并基于Ubuntu 8.04.3 LTS (hardy)
,而虚拟机管理程序和 Dom0 则Linux 2.6.26-2-xen-amd64 #1 SMP Fri Aug 14 10:19:53 UTC 2009 x86_64 GNU/Linux
基于Debian Lenny
。
有人对如何进行有什么想法吗?
答案1
显然有些人遇到了同样的问题,并在以下邮件主题中讨论了它: http://lists.centos.org/pipermail/centos-virt/2009-June/001026.html
您应该尝试“xm sched-credit”技巧:)。
问候,罗曼