100% CPU 利用率并在 virsh 迁移后挂起

Question

我找到了一个解决方案。

正如我所怀疑的，问题的原因是tsc_scalesurya 的 CPU 的功能标志缺失。

事实证明，您可以将虚拟机从没有tsc_scale它的主机迁移到有它的主机，但是运行在有它的主机上的虚拟机tsc_scale可以仅有的与它一起迁移到另一台主机。

是时候提交错误报告了。

我创建了另一个基于 ZFS ZVOL 的 DRBD，这次是在 surya 和网络上的另一台机器（我的主服务器）之间ganesh。

ganesh 是 AMD Phenom II 1090T，配备 32GB RAM，搭载 ASUS Sabertooth 990FX m/b
- CPU 标志：fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm 3dnowext 3dnow constant_tsc rep_good nopl nonstop_tsc extd_apicid aperfmperf eagerfpu pni monitor cx16 popcnt lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw ibs skinit wdt nodeid_msr cpb hw_pstate vmmcall npt lbrv svm_lock nrip_save pausefilter

我可以在 surya 和 ganesh 之间来回迁移虚拟机，没有任何问题，并且我可以将虚拟机从 surya 或 ganesh 迁移到 indra。但我无法将虚拟机从 indra 迁移到 surya 或 ganesh。

我现在可以忍受这个。当新的 AMD Zen CPU 发布时，ganesh 将进行升级，surya 将获得 ganesh 当前的主板和 RAM。我将同时为其购买新的 FX-6300 或 FX-8320，因此所有机器都会有tsc_scale.

我在网络上有另一台机器（kali），带有 FX-8320 CPU（也具有该tsc_scale功能）。我已经计划在升级 ganesh 上的主 zpool（从 4x1TB RAIDZ 到 2x4TB 镜像）并释放更多旧磁盘后立即将其添加到 ZVOL+DRBD+实时迁移实验中，这样我就能够在 indra 和 kali 之间，或在 surya 和 ganesh 之间来回迁移虚拟机。

我的虚拟机实验计划的下一阶段是编写脚本，以完全自动化设置虚拟机以在 ZVOL 上使用 DBRD 的过程，并在主机之间迁移虚拟机。

当我让它运行良好时，我将废弃它并开始使用 ganeti，它已经完成了我计划编写的内容（但更完整、更好）。

最后，当我对此感到厌倦时，我将切换到 openstack 并使用 cinder 进行卷管理。我很想跳过 ganeti 直接使用 openstack，但 ganeti 是一种很酷的技术，我想用它玩一会儿……我已经很多年没有使用它了。

Answer 1