我有两台服务器,每台服务器有大约 100 个 LUN,它们来自 IBM V7000(Storwize)。每个 LUN 有 8 条路径 - 2 个 FC 端口 x 2 个 FC 交换机 x 2 个 V7000 头 - 因此大约有 800 个设备。设备/路径由 multipathd 管理。每当其中一个 FC 交换机或端口发生故障(用于维护)时,服务器就会丢失通往所有 LUN 的一半路径,但此时一切都正常。但是,当链接恢复并且丢失的 400 条路径突然再次可用时,服务器会锁定(可能与 IO 有关)30-90 秒。
我应该在这里查看队列深度还是其他设置?另外,我应该查看服务器还是 V7000?
更新:操作系统是 CentOS 6.6 2.6.32-504.30.3.el6.x86_64,FC 卡是 QLogic 8G