过去几周,我们在一个由 15 台机器组成的集群中,每四天就会有一台机器出现这种内核崩溃问题。这些机器都运行着 Ubuntu 10.04 LTS 和 Erlang R13B03;这些机器都配备了双四核超线程 Xeon E5520 CPU。
崩溃堆栈看起来如所附图片所示(这是我们的主机托管提供商从崩溃的控制台发送给我们的):
Linux版本是:
Linux AF001783 2.6.32-28-通用 #55-Ubuntu SMP 2011 年 1 月 10 日星期一 23:42:43 UTC x86_64 GNU/Linux
奇怪的是,这些主机在一年前一直运行,没有出现过这个问题,负载曲线与以前没有太大不同。而且问题不只出现在一台主机上,如果是单台主机,我会怀疑是硬件有问题。