我有一个装有 apache 和启用了 userdir mod 的开发箱。
有时,整个 /home 分区都无法访问。Apache 无法访问存储在那里的脚本,我无法以任何方式 cd 到 /home 或 ls 其内容。
除此之外,一切都正常。Apache 可以工作(不访问 /home 时),db 可以工作,浏览其他分区也可以工作,但 /home 卡住了。
使用软件 RAID 5。
我查看了找到的每个日志,用 cat /proc/mdstat 检查 raid,一切正常,没有错误,也没有任何可疑之处。
我不知道还要去哪里查找或运行哪个诊断命令。
编辑:它已经运行了大约 5 年,没有出现问题。今天早上服务器启动时,问题就开始了。过去几天没有进行系统更新,也没有更改任何配置或任何内容。我猜是硬盘故障。
有什么线索吗?
Box 运行的是 Gentoo Linux 2.6.34-r2
DF-H
Filesystem Size Used Avail Use% Mounted on
rootfs 58G 47G 11G 81% /
/dev/root 58G 47G 11G 81% /
rc-svcdir 1,0M 76K 948K 8% /lib/rc/init.d
udev 10M 320K 9,7M 4% /dev
none 1007M 0 1007M 0% /dev/shm
/dev/md5 29G 25G 4,5G 85% /home
/dev/md6 58G 879M 57G 2% /var/svn
/dev/md7 144G 12G 132G 9% /var/www
/dev/md8 407G 406G 1,3G 100% /var/company
安装-v /home
/dev/md5 on /home type reiserfs (rw,noatime,acl)
猫/等/mtab
rootfs / rootfs rw 0 0
/dev/root / reiserfs rw,noatime 0 0
none /proc proc rw,relatime 0 0
rc-svcdir /lib/rc/init.d tmpfs rw,nosuid,nodev,noexec,relatime,size=1024k,mode=755 0 0
sysfs /sys sysfs rw,nosuid,nodev,noexec,relatime 0 0
debugfs /sys/kernel/debug debugfs rw,nosuid,nodev,noexec,relatime 0 0
udev /dev tmpfs rw,nosuid,relatime,size=10240k,mode=755 0 0
devpts /dev/pts devpts rw,nosuid,noexec,relatime,gid=5,mode=620 0 0
none /dev/shm tmpfs rw,nosuid,nodev,noexec,relatime 0 0
/dev/md6 /var/svn reiserfs rw,noatime 0 0
/dev/md7 /var/www reiserfs rw,noatime,acl 0 0
/dev/md8 /var/esoft reiserfs rw,noatime,acl 0 0
usbfs /proc/bus/usb usbfs rw,noexec,nosuid,devmode=0664,devgid=85 0 0
binfmt_misc /proc/sys/fs/binfmt_misc binfmt_misc rw,noexec,nosuid,nodev 0 0
/dev/md5 /home reiserfs rw,noatime,acl 0 0
猫/proc/mdstat
Personalities : [raid1] [raid6] [raid5] [raid4]
md1 : active raid1 sdd1[2] sdc1[3] sdb1[1] sda1[0]
40064 blocks [4/4] [UUUU]
md2 : active raid5 sdd2[2] sdc2[3] sdb2[1] sda2[0]
6024000 blocks level 5, 64k chunk, algorithm 2 [4/4] [UUUU]
md3 : active raid5 sdd3[2] sdc3[3] sdb3[1] sda3[0]
60026496 blocks level 5, 64k chunk, algorithm 2 [4/4] [UUUU]
md5 : active raid5 sdd5[2] sdc5[3] sdb5[1] sda5[0]
30025152 blocks level 5, 64k chunk, algorithm 2 [4/4] [UUUU]
md6 : active raid5 sdd6[2] sdc6[3] sdb6[1] sda6[0]
60026496 blocks level 5, 64k chunk, algorithm 2 [4/4] [UUUU]
md7 : active raid5 sdd7[2] sdc7[3] sdb7[1] sda7[0]
150030720 blocks level 5, 64k chunk, algorithm 2 [4/4] [UUUU]
md8 : active raid5 sdd8[2] sdc8[3] sdb8[1] sda8[0]
426332544 blocks level 5, 64k chunk, algorithm 2 [4/4] [UUUU]
unused devices: <none>
答案1
检查所有 4 个使 md5 错误的驱动器是否
在缓慢的时期,当你注意到问题时,运行 iostat 并查看 md5 上的读/写情况
如果在运行缓慢时什么也看不到,则运行 lsof 并查看 apache 在 /home 上打开了哪些文件
您可以尝试不同的方法 - 将目录从主目录移动到其他地方并建立符号链接 - 告诉 apache 跟随该目录的符号链接,如果问题不存在则重复,直到出现问题 - 如果没有问题,那么您的 md5 中有一个坏磁盘。
答案2
检查所有 4 个使 md5 错误的驱动器是否
在缓慢的时期,当你注意到问题时,运行 iostat 并查看 md5 上的读/写情况
如果在运行缓慢时什么也看不到,则运行 lsof 并查看 apache 在 /home 上打开了哪些文件
您可以尝试不同的方法 - 将目录从主目录移动到其他地方并建立符号链接 - 告诉 apache 跟随该目录的符号链接,如果问题不存在则重复,直到出现问题 - 如果没有问题,那么您的 md5 中有一个坏磁盘。