Ubuntu 10.10 Maverick Server 系统会随机锁定(i7 930;12GB RAM)

Ubuntu 10.10 Maverick Server 系统会随机锁定(i7 930;12GB RAM)

介绍:我有一台具有以下规格的机器:

  • 英特尔酷睿 i7 930
  • 12GB 内存 海盗船
  • 2xSamsung HDD 320gb(无 Raid,只有分区)
  • 华硕 P6TD Deluxe

该机器在数据中心才几天。平均负载为 0.50,我有以下分区:

/ext4 noatime,屏障=0,错误=重新安装-ro 0 1
 /datos ext4 noatime 0 2

现在的问题是:在随机时间间隔内,机器锁定,SSH 严重滞后,并且查看 htop,它显示所有核心都受到系统进程的打击。 http://korrupzion.com/htop.png

冻结期间的 Iostat 输出(当我最终设法在冻结期间执行命令时得到此信息):

iostat
Linux 2.6.35-22-服务器(喷火龙)25/10/10 _x86_64_(8 CPU)

平均 CPU:%用户%nice%系统%iowait%steal%idle
           4,33 0,00 10,38 1,21 0,00 84,07

设备:tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
sda 2,68 269,23 0,01 906918 24
sdb 52,30 897,99 1896,08 3024878 6386976

Vmstat 输出:

vmstat 1
进程 -----------内存---------- ---交换-- -----io---- -系统-- ----cpu----
 rb swpd 免费 buff 缓存 si so bi bo in cs us sy id wa
 0 1 0 5680460 128056 1907340 0 0 115 131 1091 2621 4 9 86 1
 4 0 0 5676360 128064 1909036 0 0 1872 52 4606 18143 10 33 57 0

我怀疑 ext4 与这些冻结有关,但我不确定。Ubuntu 是在一周前安装的,在将机器发送到数据中心之前,在此之前,我使用 Windows 7 来测试性能,没有出现任何类型的冻结

如果你知道另一个命令来追踪此冻结的来源,请告诉我,我正在考虑再次格式化为 debian lenny,这是我用来安装到其他机器的 SO,没有问题

谢谢。

编辑1:我重新安装了“/datos”,并将 barrier=0 设置成现在我正在监控问题是否再次出现。

编辑2:重新安装 /datos 并使用 barrier=0 无效 uu 仍在尝试寻找解决方案

答案1

五天前,我刚刚向 Launchpad 报告了有关同一问题的错误。它也是 Intel Core i7-930,位于 Intel DX58SO 主板中:

https://bugs.launchpad.net/ubuntu/+source/linux/+bug/665796

您的问题肯定是相同的,您的描述与我的问题非常吻合。检查您的系统计时器中断是否在这些锁定期间冻结。在终端中保持此操作:

watch -d grep timer /proc/interrupts

在锁定期间,您需要一个外部中断源,以便使进程调度程序运行并查看命令的执行情况。从另一台机器 ping 您的计算机(间隔一小段时间)会有所帮助。

如果在锁定期间定时器中断停止递增,则存在同样的问题。请将您的系统信息添加到上述错误报告中,以便我们引起 Ubuntu 开发人员的注意:

ubuntu-bug -u 665796 -p linux

答案2

除了 CPU 的冲击之外,我猜这是与 DNS 有关的。

我猜测 DNS 的原因是

  1. 该机器已移至新的数据中心
  2. 随机冻结通常是由于尝试连接时超时导致的

您是否已检查 resolv.conf 并确认 DNS 服务器可以访问?

答案3

使用 10.10 时也遇到过同样的问题,同样是 Core-i7 930,但 RAM 却只有区区 6 GB。经研究,可能可能是 Xorg 回归的问题 - 您是否使用任何类型的 GUI 桌面环境?如果是,此错误报告可能与您相关: https://bugs.launchpad.net/ubuntu/+source/xorg/+bug/658649

相关内容