我有一个在富士通 BX922S2 刀片服务器上运行的 VMware ESXi 5 环境,连接到富士通 DX90 SAN。
我对 RAID5 卷没有问题,但 RAID10 卷(用于 MSSQL)表现出荒谬的写入延迟 - 有时超过 1000 毫秒,从未低于 30 毫秒。这些延迟数字是在 VMware 中测量的,使用相关 SQL 服务器的“性能”选项卡,更改为“高级”,然后切换到“数据存储区”视图。
DBA 注意到了这一点,并编写了一个快速脚本来在服务器上不断创建一个 1GB 的文件。
将 SQL 日志驱动器迁移到同一 SAN 上的 RAID 5 卷没有出现明显的写入延迟。
有人能指出我配置错误导致这种情况的明显原因吗?
答案1
我的 SAN 经验是在虚拟 SAN 方面,但对我来说,这听起来像是您遇到的情况如下。
- 您已确认当前的 RAID 5 运行良好,但 RAID 0、1 或 5 的组合均无法正常工作。您澄清说,您最初是在两个机架上执行 RAID 10,并且您已尝试过其他简单配置。您遗漏的是,您是否会再次在机架上尝试这些配置?我会在一个机架上尝试简单的 RAID 0,然后在另一个机架上尝试另一个。也许只是其中一个机架不堪重负。
- 您没有提到是否尝试过在非 VMware 主机上执行此操作。我会尝试通过其他外部设备进行连接。这只是为了消除 VMware 配置问题。
- 您的交换机看起来怎么样?您有冗余交换机吗?您有多个 HBA 吗?或者至少有一个双端口 HBA?
- 我认为这不是网络问题(san 方面),只是因为我认为你会看到多个 lun 之间的性能波动
- 你在 vmware 中启用了多路径吗?我怀疑富士通有一个用于此的扩展包。
- 如果是我,我会打电话给 SAN 供应商,询问为什么速度会这么慢。也许他们有明显的原因。
- 顺便说一句,我认为这都是光纤通道?
答案2
确定是否可以将写入延迟问题归结为特定控制器。检查所有电缆。检查 FC/iSCSI 交换机特定端口上是否存在错误。尝试在未启用 MPIO 的情况下进行测试。尝试在 VMware 之外直接测试写入卷。
在此之后,让制造商弄清楚......这绝对是他们要解决的问题。