Debian wheezy AMD64,3 核,2560mb 内存(虚拟机)。 1 个 ext4 上的虚拟驱动器,在 KVM 上运行。
我决定将其从 raw 移至 qcow2。一切都很好,迁移过程中一切都很顺利。但这并没有解决我的问题。 I/O 一直很慢,在迁移到 qcow2 后仍然很慢。
这是来自 munin 的屏幕截图,其中显示了图表: http://wikisend.com/download/798312/bad_kvm_virtual.png
服务滞后。在 iotop 上——几乎什么也没有显示。
vmstat 1 显示:
procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----
r b swpd free buff cache si so bi bo in cs us sy id wa
0 0 0 253232 95936 883488 0 0 9 23 145 82 5 4 87 4
1 0 0 253108 95936 883488 0 0 0 0 597 1045 4 3 94 0
0 0 0 253108 95936 883488 0 0 0 0 596 1228 4 4 93 0
0 0 0 252488 95936 883488 0 0 136 0 424 2216 4 4 90 2
0 0 0 244800 95936 885540 0 0 1924 0 629 1387 4 5 85 7
0 0 0 244800 95936 885548 0 0 0 0 408 2576 3 4 93 0
1 0 0 244800 95936 885548 0 0 0 0 388 1852 3 3 94 0
0 0 0 244800 95936 885548 0 0 0 0 387 2077 4 4 92 0
0 0 0 244908 95952 885540 0 0 0 788 623 2146 3 5 73 19
0 0 0 244948 95952 885544 0 0 0 0 477 1417 3 2 94 0
0 0 0 245024 95952 885544 0 0 0 12 527 2356 3 4 92 0
0 0 0 245024 95952 885544 0 0 0 0 406 1929 3 4 93 0
0 0 0 245024 95952 885544 0 0 0 572 319 2273 3 4 94 0
1 0 0 244900 95956 885540 0 0 0 80 398 2296 4 2 87 7
0 0 0 244900 95956 885544 0 0 0 0 334 2497 3 3 93 0
0 0 0 244900 95956 885544 0 0 0 0 315 2090 3 3 94 0
0 0 0 244900 95956 885544 0 0 0 0 330 2291 3 3 94 0
0 0 0 244900 95956 885544 0 0 0 0 385 2256 4 4 92 0
0 0 0 230516 95956 885544 0 0 60 0 570 1702 4 4 92 0
2 0 0 230448 95956 885604 0 0 0 0 341 2280 4 4 93 0
0 0 0 230448 95956 885604 0 0 0 0 327 2478 3 3 93 0
0 0 0 230448 95956 885604 0 0 0 0 335 2288 4 3 93 0
0 0 0 230200 95964 885596 0 0 0 180 344 2123 4 3 88 5
0 0 0 230200 95964 885604 0 0 0 0 450 1926 3 5 93 0
0 0 0 230200 95964 885604 0 0 0 0 390 2202 4 4 92 0
0 0 0 230200 95964 885604 0 0 0 0 325 2282 4 4 92 0
0 0 0 230200 95964 885604 0 0 0 0 332 2293 4 3 93 0
0 0 0 230200 95964 885604 0 0 0 0 423 1778 4 3 93 0
0 0 0 230200 95968 885604 0 0 0 4 375 2261 3 4 92 1
0 0 0 230200 95968 885604 0 0 0 0 319 2279 3 4 93 0
0 0 0 230200 95968 885604 0 0 0 0 397 2609 3 4 93 0
0 0 0 230200 95968 885604 0 0 0 0 328 2481 3 4 93 0
这就是我的问题。它显示 - I/O 时间非常长,但虚拟机内部没有任何问题。没有进程消耗太多资源。
procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----
r b swpd free buff cache si so bi bo in cs us sy id wa
1 1 0 177880 96116 886304 0 0 0 0 451 1908 4 3 61 32
0 1 0 177880 96116 886304 0 0 0 0 400 1735 3 3 63 31
0 1 0 177880 96116 886304 0 0 0 0 359 2143 4 4 62 30
0 1 0 177284 96124 886272 0 0 0 216 813 1283 11 7 55 27
0 1 0 177316 96124 886300 0 0 0 0 439 2411 3 4 61 31
2 0 0 190344 96124 886316 0 0 0 76 1272 1986 14 7 77 3
0 0 0 190988 96124 886288 0 0 0 36 859 1714 10 6 84 0
2 0 0 191112 96124 886304 0 0 0 40 749 1494 12 4 84 0
0 0 0 191160 96124 886296 0 0 0 40 437 2156 12 3 84 0
1 0 0 191160 96124 886300 0 0 0 164 653 1466 8 3 80 9
0 0 0 191160 96124 886320 0 0 0 36 588 2428 10 4 85 0
1 0 0 191284 96124 886260 0 0 0 36 567 1534 10 3 86 0
0 0 0 191432 96124 886292 0 0 0 56 669 1436 16 3 81 0
1 0 0 191556 96124 886280 0 0 0 52 779 1212 14 4 82 0
0 0 0 191432 96128 886320 0 0 0 180 425 2167 9 4 69 18
0 0 0 191432 96128 886312 0 0 0 48 689 1236 11 4 84 0
1 0 0 190860 96128 886320 0 0 0 56 690 1713 22 4 74 0
1 0 0 190364 96128 886284 0 0 0 48 735 1398 20 5 75 0
1 0 0 190240 96128 886284 0 0 0 56 795 1713 24 3 73 0
0 0 0 189744 96136 886288 0 0 0 208 704 1057 9 4 73 15
0 0 0 189744 96136 886292 0 0 0 84 832 1405 20 5 75 0
1 0 0 189744 96136 886316 0 0 0 56 631 1178 12 4 84 0
0 2 0 189372 96136 886316 0 0 0 1588 478 2171 6 3 65 26
0 2 0 189372 96136 886316 0 0 0 0 353 2503 3 4 63 30
0 2 0 189372 96136 886316 0 0 0 0 441 2106 3 3 63 31
0 2 0 189248 96140 886312 0 0 0 792 367 2328 3 4 37 56
0 2 0 189248 96140 886312 0 0 0 0 360 2307 3 4 32 61
0 2 0 189248 96140 886312 0 0 0 0 354 2140 3 3 33 61
0 2 0 189248 96140 886312 0 0 0 0 354 2320 2 4 32 62
0 2 0 189248 96140 886312 0 0 0 0 473 1691 4 4 31 61
1 2 0 189248 96140 886312 0 0 0 468 339 2295 3 4 40 52
0 2 0 189248 96140 886312 0 0 0 0 312 2468 3 3 32 62
0 2 0 189248 96140 886312 0 0 0 0 552 1338 3 4 33 61
0 2 0 189248 96140 886312 0 0 0 0 615 1088 4 3 33 60
0 2 0 189248 96140 886312 0 0 0 0 560 1061 2 5 32 61
0 2 0 189248 96140 886312 0 0 0 348 316 2488 3 3 32 62
0 2 0 189248 96140 886312 0 0 0 0 497 1245 2 5 30 63
0 2 0 189248 96140 886312 0 0 0 0 374 2037 3 3 31 63
0 1 0 189248 96140 886312 0 0 0 440 364 2152 4 3 42 52
0 1 0 189248 96140 886312 0 0 0 0 423 1996 3 4 63 31
0 1 0 189248 96140 886312 0 0 0 0 375 2150 3 4 62 31
0 1 0 189248 96140 886312 0 0 0 0 596 1053 3 4 63 30
0 1 0 189248 96148 886312 0 0 0 1796 344 2300 5 4 61 30
0 1 0 189248 96148 886316 0 0 0 0 324 2486 3 4 61 32
0 1 0 189248 96148 886316 0 0 0 0 325 2294 4 3 62 32
0 1 0 209740 96152 886308 0 0 0 8 503 1446 4 4 63 29
0 0 0 209864 96152 886308 0 0 0 0 601 1082 3 4 82 11
0 0 0 209864 96152 886308 0 0 0 1772 473 1751 4 3 93 0
0 0 0 209864 96152 886312 0 0 0 0 532 1299 3 4 93 0
0 0 0 210644 96152 886312 0 0 0 12 586 2024 3 4 90 0
0 1 0 210660 96156 886312 0 0 0 152 497 2271 3 5 83 8
0 0 0 210536 96156 886316 0 0 0 4 455 2088 4 3 84 8
0 0 0 210536 96156 886316 0 0 0 1620 375 2518 4 5 92 0
物理服务器运行 SW RAID 6,所有驱动器均正常。所有硬盘均为 7200 RPM WD RE4,出生日期不同。
用户在使用其服务时有时会出现 3 秒的延迟。文件系统仅占使用率的 57%。随机的,不是在特定的时间。
是否存在未安装 kvm 来宾添加的问题? (我从未见过 Linux 或 debian 的一些来宾添加)。
在同一台服务器上,在其他虚拟机上不会发生这种情况,所以我想,这台机器的linux内部一定有问题。您认为问题出在哪里?
会不会是某些硬盘坏道的问题?但检查dev/md1没有发现任何问题。
该怎么办?
- - -编辑 - - -
答案1
qcow2 比原始图像慢得多。使用原始逻辑卷是最有效地利用硬件。此外,raid10 将提供更高的 IOPS。