KVM 客户机启动后不久进入暂停状态

KVM 客户机启动后不久进入暂停状态

我有两台非常相似的 x86_64 机器,它们运行相同的内核 (4.7.8) 和相同版本的 libvirt。两台机器之间的唯一区别是它们拥有的内存量,机器 A 有 8G,而机器 B 有 32G,以及运行的 BIOS 版本(更多详细信息见下文)。

在机器 AI 上,可以毫无问题地运行客户机,但在机器 B 上,客户机在启动时(总是在启动阶段)进入暂停状态的情况非常常见,我无法恢复它。这种情况经常发生,当两个客户机一个接一个地启动时,这种情况更常见,这时一个或两个客户机经常会进入暂停状态。这个问题从未在机器 A 上发生过。

查看客人的日志我可以看到当出现问题时发生了子错误 3:

2020-05-02 16:38:16.949+0000: starting up libvirt version: 1.2.20, qemu version: 2.6.0
LC_ALL=C PATH=/bin:/usr/bin QEMU_AUDIO_DRV=none /usr/bin/qemu-system-x86_64 -name testvm -S -machine pc-1.1,accel=kvm,usb=off -cpu Broadwell,+abm,+pdpe1gb,+rdrand,+f16c,+osxsave,+pdcm,+xtpr,+tm2,+est,+smx,+vmx,+ds_cpl,+monitor,+dtes64,+pbe,+tm,+ht,+ss,+acpi,+ds,+vme -m 512 -realtime mlock=off -smp 1,sockets=1,cores=1,threads=1 -uuid e1e10e42-55f5-4927-aa31-71114d9edc33 -smbios type=1,product=QEMU -no-user-config -nodefaults -chardev socket,id=charmonitor,path=/var/lib/libvirt/qemu/domain-testvm/monitor.sock,server,nowait -mon chardev=charmonitor,id=monitor,mode=control -rtc base=localtime,clock=vm,driftfix=slew -no-shutdown -boot strict=on -device ich9-usb-ehci1,id=usb,bus=pci.0,addr=0x5.0x7 -device ich9-usb-uhci1,masterbus=usb.0,firstport=0,bus=pci.0,multifunction=on,addr=0x5 -device ich9-usb-uhci2,masterbus=usb.0,firstport=2,bus=pci.0,addr=0x5.0x1 -device ich9-usb-uhci3,masterbus=usb.0,firstport=4,bus=pci.0,addr=0x5.0x2 -drive file=/mnt/disk0/.libvirt/ubmtest_0.img,if=none,id=drive-ide0-0-0,format=qcow2,cache=directsync,aio=native -device ide-hd,bus=ide.0,unit=0,drive=drive-ide0-0-0,id=ide0-0-0,bootindex=2 -netdev tap,fd=18,id=hostnet0 -device e1000,netdev=hostnet0,id=net0,mac=52:54:01:fa:01:51,bus=pci.0,addr=0x3 -netdev tap,fd=19,id=hostnet1 -device e1000,netdev=hostnet1,id=net1,mac=52:54:02:fa:02:51,bus=pci.0,addr=0x6 -netdev tap,fd=20,id=hostnet2 -device e1000,netdev=hostnet2,id=net2,mac=52:54:0b:fa:0b:51,bus=pci.0,addr=0x7 -netdev tap,fd=21,id=hostnet3 -device e1000,netdev=hostnet3,id=net3,mac=52:54:64:fa:64:51,bus=pci.0,addr=0x8 -netdev tap,fd=22,id=hostnet4 -device e1000,netdev=hostnet4,id=net4,mac=52:54:c8:fa:c8:51,bus=pci.0,addr=0x9 -netdev tap,fd=23,id=hostnet5 -device e1000,netdev=hostnet5,id=net5,mac=52:54:d3:fa:d3:51,bus=pci.0,addr=0xb -netdev tap,fd=24,id=hostnet6 -device e1000,netdev=hostnet6,id=net6,mac=52:54:dd:fa:dd:51,bus=pci.0,addr=0xa -netdev tap,fd=25,id=hostnet7 -device e1000,netdev=hostnet7,id=net7,mac=52:54:ff:fa:ff:51,bus=pci.0,addr=0xc -chardev pty,id=charserial0 -device isa-serial,chardev=charserial0,id=serial0 -device usb-tablet,id=input0 -vnc 0.0.0.0:0 -device cirrus-vga,id=video0,bus=pci.0,addr=0x2 -device virtio-balloon-pci,id=balloon0,bus=pci.0,addr=0x4 -msg timestamp=on
Domain id=1 is tainted: high-privileges
char device redirected to /dev/pts/0 (label charserial0)
KVM internal error. Suberror: 3
extra data[0]: 8000003e
extra data[1]: 31
RAX=0000000000000000 RBX=ffffffff81f38280 RCX=0000000000000000 RDX=0000000000000000
RSI=0000000000000000 RDI=0000000000000000 RBP=ffffffff81e03e98 RSP=ffffffff81e03e98
R8 =ffff88001fc0dd80 R9 =0000000000000000 R10=00000000fffee09f R11=0000000000037000
R12=0000000000000000 R13=0000000000000000 R14=0000000000000000 R15=ffffffff81e00000
RIP=ffffffff810645d6 RFL=00000246 [---Z-P-] CPL=0 II=0 A20=1 SMM=0 HLT=0
ES =0000 0000000000000000 ffffffff 00000000
CS =0010 0000000000000000 ffffffff 00a09b00 DPL=0 CS64 [-RA]
SS =0018 0000000000000000 ffffffff 00c09300 DPL=0 DS   [-WA]
DS =0000 0000000000000000 ffffffff 00000000
FS =0000 0000000000000000 ffffffff 00000000
GS =0000 ffff88001fc00000 ffffffff 00000000
LDT=0000 0000000000000000 000fffff 00000000
TR =0040 ffff88001fc142c0 00002087 00008b00 DPL=0 TSS64-busy
GDT=     ffff88001fc09000 0000007f
IDT=     ffffffffff574000 00000fff
CR0=80050033 CR2=00007f1cb3691037 CR3=00000000167a7000 CR4=003406f0
DR0=0000000000000000 DR1=0000000000000000 DR2=0000000000000000 DR3=0000000000000000 
DR6=00000000fffe0ff0 DR7=0000000000000400
EFER=0000000000000d01
Code=89 e5 fb 5d c3 66 0f 1f 84 00 00 00 00 00 55 48 89 e5 fb f4 <5d> c3 0f 1f 84 00 00 00 00 00 55 48 89 e5 f4 5d c3 66 0f 1f 84 00 00 00 00 00 55 49 89 c9

正如我之前提到的,两个系统上的所有软件都是相同的,并且大部分硬件也是如此。

以下是两位嘉宾分享的一些相关规格:

  • CPU:英特尔(R) 酷睿(TM) i5-5350U CPU @ 1.80GHz
  • 内核:4.7.8
  • libvirt 1.2.20
  • QEMU 2.6.0

相关区别:

  • 机器 A BIOS:American Megatrends Inc. v0.04 06/16/2016 版本 5.6
  • 机器 B BIOS:American Megatrends Inc. v0.02 07/07/2015 版本 5.6

有人知道这里可能发生了什么吗?这可能与不同的 BIOS 版本有关吗?

谢谢

相关内容