我收到报告称某个文件系统(即 /srv/data1)的 I/O 间歇性地出现严重问题。我亲眼见过,确实如此。例如,我运行“ls”/srv/data1,输出需要 30 多秒才能显示。我再次运行它,这次没有延迟。正常和严重问题的时间很短,而且循环相当快。
/srv/data1 是 /dev/drbd1 上的 500GB OCFS2,而 /dev/drbd1 又位于 systemA:/dev/md3 和 systemB:/dev/md3 上。A 和 B 是运行 SLES11 的相同 Dell R610。A 和 B 上的 /dev/md3 是 /dev/sdc1 和 /dev/sdd1 的镜像。这些是 500 GB SATA 驱动器,仅用于其他用途。HDD 控制器是 Dell 的 PERC 6/iR。
这是一个非常繁忙的主 Subversion 服务器,延迟会破坏一些使远程代理服务器与此主服务器保持同步的进程。这给开发团队带来了麻烦。
有什么想法吗?
谢谢,迈克
答案1
我断定我们已经达到了系统的极限。我们将数据移至 EMC SAN LUN,现在速度提高了一个数量级。
答案2
您是否使用默认选项进行安装?如果 ocfs2 集群中有多个节点并且有写入活动,请尝试使用诺亚泰选项或至少另一个相对修改时间选项。