介绍:我有一台具有以下规格的机器:
- 英特尔酷睿 i7 930
- 12GB 内存 海盗船
- 2xSamsung HDD 320gb(无 Raid,只有分区)
- 华硕 P6TD Deluxe
该机器在数据中心才几天。平均负载为 0.50,我有以下分区:
/ext4 noatime,屏障=0,错误=重新安装-ro 0 1 /datos ext4 noatime 0 2
现在的问题是:在随机时间间隔内,机器锁定,SSH 严重滞后,并且查看 htop,它显示所有核心都受到系统进程的打击。 http://korrupzion.com/htop.png
冻结期间的 Iostat 输出(当我最终设法在冻结期间执行命令时得到此信息):
iostat Linux 2.6.35-22-服务器(喷火龙)25/10/10 _x86_64_(8 CPU) 平均 CPU:%用户%nice%系统%iowait%steal%idle 4,33 0,00 10,38 1,21 0,00 84,07 设备:tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn sda 2,68 269,23 0,01 906918 24 sdb 52,30 897,99 1896,08 3024878 6386976
Vmstat 输出:
vmstat 1 进程 -----------内存---------- ---交换-- -----io---- -系统-- ----cpu---- rb swpd 免费 buff 缓存 si so bi bo in cs us sy id wa 0 1 0 5680460 128056 1907340 0 0 115 131 1091 2621 4 9 86 1 4 0 0 5676360 128064 1909036 0 0 1872 52 4606 18143 10 33 57 0
我怀疑 ext4 与这些冻结有关,但我不确定。Ubuntu 是在一周前安装的,在将机器发送到数据中心之前,在此之前,我使用 Windows 7 来测试性能,没有出现任何类型的冻结
如果你知道另一个命令来追踪此冻结的来源,请告诉我,我正在考虑再次格式化为 debian lenny,这是我用来安装到其他机器的 SO,没有问题
谢谢。
编辑1:我重新安装了“/datos”,并将 barrier=0 设置成现在我正在监控问题是否再次出现。
编辑2:重新安装 /datos 并使用 barrier=0 无效 uu 仍在尝试寻找解决方案
答案1
五天前,我刚刚向 Launchpad 报告了有关同一问题的错误。它也是 Intel Core i7-930,位于 Intel DX58SO 主板中:
https://bugs.launchpad.net/ubuntu/+source/linux/+bug/665796
您的问题肯定是相同的,您的描述与我的问题非常吻合。检查您的系统计时器中断是否在这些锁定期间冻结。在终端中保持此操作:
watch -d grep timer /proc/interrupts
在锁定期间,您需要一个外部中断源,以便使进程调度程序运行并查看命令的执行情况。从另一台机器 ping 您的计算机(间隔一小段时间)会有所帮助。
如果在锁定期间定时器中断停止递增,则存在同样的问题。请将您的系统信息添加到上述错误报告中,以便我们引起 Ubuntu 开发人员的注意:
ubuntu-bug -u 665796 -p linux
答案2
除了 CPU 的冲击之外,我猜这是与 DNS 有关的。
我猜测 DNS 的原因是
- 该机器已移至新的数据中心
- 随机冻结通常是由于尝试连接时超时导致的
您是否已检查 resolv.conf 并确认 DNS 服务器可以访问?
答案3
使用 10.10 时也遇到过同样的问题,同样是 Core-i7 930,但 RAM 却只有区区 6 GB。经研究,可能可能是 Xorg 回归的问题 - 您是否使用任何类型的 GUI 桌面环境?如果是,此错误报告可能与您相关: https://bugs.launchpad.net/ubuntu/+source/xorg/+bug/658649