我有一台运行 Ubuntu 11.04 服务器的服务器,没有 GUI。它会随机锁定。不响应 ping。控制台访问也被锁定并且没有响应。我无法在 syslog、kernlog 或 dmesg 中找到任何提供有关它锁定原因的信息。
服务器信息 CPU - Intel Xeon e5649 @ 2.53GHz
RAM - SAMSUNG 4GB 240 针 DDR3 SDRAM DDR3 1333 ECC 无缓冲 总共 24 Gb 硬盘 - 2 - 镜像 raid 5 中的 2tb 硬盘 - raid 10 中的 3tb 硬盘,使用软件 raid mdstat 备用 MOBO - SUPERMICRO MBD-X8STI-O
如果您需要更多信息请告诉我
答案1
首先排除与温度有关的情况,即是否有足够的冷却。风扇故障或 CPU 上没有导热膏都可能导致这种情况。
然后尝试运行不同的内核,如果你不是最新版本,请转到此处。或者,如果你很着急,请跳过此步骤,并假设它与硬件有关(很可能是这种情况)。
对于硬件,我会开始测试内存,最好是离线测试http://www.memtest.org。如果出现任何错误,请使用单独的 RAM 组进行测试,以尝试排除坏的内存条。根据我的经验,这最有可能导致随机错误,但在大多数情况下,使用 memtest 进行一两天的测试后应该会出现。
接下来我可能会抛出“压力”或其他引发重负载的二进制文件,看看能否减少崩溃的随机性。如果负载会导致崩溃,则可能是硬件问题,可能是电源或主板问题。