我有一台装有 12 个 300gb DP SAS 驱动器的 iSCSI HP P2000。它连接到 2 台运行 XenServer 的 64gb RAM DL385 服务器。SAN 网络通过 2 个千兆交换机进行多路径传输(从 P2000 到每个交换机有 4 条铜缆链路,然后每个 XenServer 到每个交换机都有一条铜缆链路)
最近我重新评估了安装时创建 2 个虚拟磁盘的决定:一个 RAID-5 和一个 RAID-10。我认为 RAID-5 毫无意义,因此将其销毁,然后使用这些磁盘将 RAID-10 扩展为一个大阵列,并带有 2 个热备用磁盘。
自从完成这件事(就在一周前)以来,磁盘性能一直非常糟糕;查看top
两个 XenServer 主机都显示~15% 的 I/O 等待时间。VM 内部的 hdparm 显示1.12MB/s
从 SAN 读取的数据。
另外还有 2 台 Win2008R2 机器也连接到 SAN。我之前的性能测试显示它们也经历了显著的差异,因此我不认为这是 XenServer 主机上的问题。
- 以前是 8k 随机读取
~24.75MB/s
,现在1.67MB/s
- 以前是 64k 随机读取
~170MB/s
,现在3.61MB/s
RAID 扩展已完成,SMU 中一切正常。XenServer 相当“空”(其中一个上有 7 个 VM,另一个上有 4 个 VM),但它是一个生产环境。
答案1
经过进一步调查后,结果发现问题在于有人(咳嗽)根据一篇互联网文章的建议在 SAN 交换机上启用了流量控制,该文章讨论了完全相同的硬件并明确鼓励使用流量控制。
禁用流量控制后,平均负载和 I/O 等待立即减少,24 小时后,一旦一些困难的维护任务完成,它就完全恢复正常(0.0%wa 和平均负载 < 0.10)。