我有一台运行 apache、postgresql 和许多网站的服务器,托管提供商提供的图表显示磁盘基本处于持续抖动状态。磁盘使用率为 10k/s。这似乎是一个坏主意,但我真的不知道为什么——负载正常,服务器响应时间合理。起初我以为是机器卡在交换区,因为每个运行的网站都有 2 个应用服务器线程,但减少运行的网站数量,磁盘使用率仍然很高。使用的交换区很少,但可用内存很多。从顶部开始:
load average: 0.70, 0.28, 0.21
Cpu(s): 3.6%us, 1.4%sy, 0.0%ni, 93.9%id, 0.7%wa, 0.0%hi, 0.0%si, 0.4%st
Mem: 1731880k total, 1530124k used, 201756k free, 68360k buffers
Swap: 2359288k total, 1676k used, 2357612k free, 884892k cached
因此我查看了 vmstat,它说交换不是问题:
root@foobar# vmstat 1
procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----
r b swpd free buff cache si so bi bo in cs us sy id wa
0 0 1676 175220 68120 880856 0 0 1 20 20 15 4 1 94 1
0 0 1676 174096 68140 881140 0 0 0 6484 1452 487 2 1 97 0
0 0 1676 173848 68156 881420 0 0 0 5804 899 310 0 1 99 0
0 0 1676 173600 68168 881768 0 0 0 5376 834 266 0 0 98 2
0 0 1676 173228 68176 881880 0 0 0 5376 775 259 0 1 99 0
1 0 1676 173044 68188 882152 0 0 0 3584 626 249 0 1 99 0
0 0 1676 172796 68208 882424 0 0 0 6668 1450 593 2 1 97 0
1 0 1676 181352 68224 882700 0 0 0 5760 2373 1038 3 2 95 0
0 0 1676 181336 68228 882836 0 0 0 5376 3367 1289 7 1 91 0
0 0 1676 181088 68236 883264 0 0 0 5376 1294 508 2 1 97 0
0 0 1676 180848 68252 883440 0 0 0 5376 1217 410 1 1 98 0
0 0 1676 180716 68264 883480 0 0 0 8444 1127 270 0 1 99 0
0 0 1676 181584 68272 883488 0 0 0 5676 1285 624 1 1 98 0
0 0 1676 180956 68272 883496 0 0 0 5376 1069 377 1 1 97 0
0 0 1676 180964 68272 883496 0 0 0 5376 753 299 0 1 99 0
我尝试增加 postgresql 的 shared_mem 和 work_mem 设置,但无济于事。我真的不知道如何追踪发生了什么。
编辑:以下是 iotop 的重大披露:
26331 be/4 postgres 0.00 B/s 5.00 M/s 0.00 % 0.00 % postgres: stats collector process
基本上是持续运行。其他一切都在几 kbps 以内。
有什么建议么?
答案1
iotop
将突显问题的原因。