如何诊断多操作系统可重现的启动 - 重启循环?

如何诊断多操作系统可重现的启动 - 重启循环?

上周末,我们的一个 Beowulf 集群节点离线了。这是一台 Fedora 16 机器。当我尝试启动它时,它会经过 grub,进入“初始化 ramdisk...”然后每次都会重新启动。从 Windows 7 CD 启动时,在“正在启动 Windows...”徽标动画出现后,它也会重新启动。我运行了 MemTestx86,多次运行都没有错误。目前这不是过热问题,但一些硬件可能因热应力而损坏,因为直到本周,我们还没有为顶层架子上的这些集群节点提供良好的通风。

该机器是七个 mini-ITX 节点之一,i7 2600K仅带有内置视频。它在ASRock Z68M-ITX/HT主板上。它一直超频到 4.1Ghz,其 DDR3 RAM 运行在 1833(在此 RAM 的规格范围内)。在尝试诊断它时,我将其重新设置为标准时钟速度,但没有任何变化。我很确定这不是硬盘的问题,因为当将其外部插入另一个节点时,它在所有分区上都通过了 fsck.ext4,并且从 CD 启动时也会重新启动。

有没有办法可以增加 Linux 启动期间的细节级别,以便我可以在它重新启动之前准确地看到它的位置?

相关内容