我的专用服务器在重新启动后出现问题。在我运行 top 命令后,cpu 平均负载非常高,如下所示。
top - 23:40:41 up 50 min, 3 users, load average: 236.24, 146.96, 124.29
Tasks: 556 total, 1 running, 555 sleeping, 0 stopped, 0 zombie
Cpu(s): 1.2%us, 0.2%sy, 0.0%ni, 0.0%id, 98.6%wa, 0.0%hi, 0.0%si, 0.0%st
Mem: 16230212k total, 2994040k used, 13236172k free, 26404k buffers
Swap: 2097144k total, 0k used, 2097144k free,
我试图停止 httpd,它显示“OK”,但在我运行“service httpd status”后它仍然显示它正在运行。
运行“ps -ef | grep httpd”后,出现许多与 httpd 相关的进程
apache 7984 7209 0 23:42 ? 00:00:00 /usr/sbin/httpd -k start -DSSL
apache 7985 7209 0 23:42 ? 00:00:00 /usr/sbin/httpd -k s
我不知道它是什么,但它每秒都会重复一次(pid 运行非常快)
在我深入研究 unix 日志(var/log/message)后,它显示一些可能与硬盘相关的日志,我不太确定,是吗?
Nov 10 00:16:13 host kernel: ata1.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
Nov 10 00:16:13 host kernel: ata1.00: irq_stat 0x40000008
Nov 10 00:16:13 host kernel: ata1.00: failed command: READ FPDMA QUEUED
Nov 10 00:16:13 host kernel: ata1.00: cmd 60/08:00:f0:e1:4a/00:00:6b:00:00/40 tag 0 ncq 4096 in
Nov 10 00:16:13 host kernel: res 41/40:08:f0:e1:4a/00:00:6b:00:00/00 Emask 0x409 (media error) <F>
Nov 10 00:16:13 host kernel: ata1.00: status: { DRDY ERR }
Nov 10 00:16:13 host kernel: ata1.00: error: { UNC }
Nov 10 00:16:13 host kernel: ata1.00: configured for UDMA/133
Nov 10 00:16:13 host kernel: ata1: EH complete
请告诉我下一步该怎么做才能让我的服务器恢复正常。
此致,
答案1
我假设您正在运行 Red Hat(因为“HTTPD”)。看起来您的硬盘驱动器出现故障。我建议您在驱动器上安装并运行 SMART 以进行确认。
yum install smartmontools
然后例如检查你的第一个驱动器
smartctl -a /dev/sda
这将输出一大堆信息,你需要注意底部附近,你可能会看到类似这样的信息
Error 6 occurred at disk power-on lifetime: 2263 hours (94 days + 7 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 71 04 81 87 80 e0 Device Fault; Error: ABRT
这意味着您的驱动器出现故障,您应该尽快备份并更换驱动器。如果您发布输出,我们可以更详细地查看。
答案2
您的硬盘出现故障。请更换有故障的硬盘。