我有一台 HP Proliant DL380 G7,配备 HP SmartArray P812 W 1G-BBWC,它插入 D2600 存储机箱,配有 1 根 mini sas 电缆。所有固件版本都是最新版本(包括磁盘)。内部背板也插入内部 SAS 端口。
有一个 RAID 5 存储阵列(跨 3 * 4TB SATA 磁盘)和三个 RAID 1 阵列,跨 1TB SATA 磁盘。此外,还有连接到控制器内部端口的内部 SAS 2.5 英寸磁盘。3 X 300GB Raid 5 和 2 X 300GB RAID 1。这个问题似乎影响“内部”磁盘和 D2600 机箱中的磁盘。
我遇到了此系统的一些非常奇怪的性能问题,我无法追踪。
该服务器正在从内部 HP Enterprise USB 存储设备运行 ESXi 6。
磁盘负载低时,没有问题。问题就出在这里。如果我将基准文件从一个磁盘阵列复制到另一个磁盘阵列,它最初会以 250mb/s 的速度运行一段随机的时间(10 到 45 秒之间)。此后,磁盘 IO 会大幅下降,变得非常随机。(见屏幕截图)。
如果 IO 负载继续,最终传输将降至 0,并且阵列将完全停止响应。
同时,ESX 主机记录以下内容:
Device naa.bla performance has deteriorated. I/O latency increased from average value of 5134 microseconds to 434632 microseconds.
同一服务器上的 Linux 机器显示以下结果:
值得注意的是1800毫秒的延迟!
如果阵列完全停止响应,唯一的恢复方法是重新启动主机。所有阵列都会发生这种情况,无论是内部还是外部阵列。我尝试了第二台 D2600 和另一条 SAS 电缆。没有变化。禁用 Windows 写入缓存或驱动器本身的磁盘缓存没有任何区别。
我完全被困在这个阶段并且抓狂不已,任何帮助都将非常感激!
答案1
您正在运行 HP DL380 G7,它应该有一个内部 Smart Array P410 阵列控制器。
- 您能发布 VMware ESXi 版本号吗?驱动程序和 HPSA 版本很重要。可能需要更新。
- 我建议将 P410 用于内部磁盘,并将 P812 用于外部机箱。
- 您还应该对 D2600 使用 SAS 磁盘和双域布线(2 条电缆/多路径)。
- P812 内嵌有 SAS 扩展器。D2600 内嵌有 SAS 扩展器。SATA 磁盘在这种设置下运行不佳。速度也可能降至 3Gbps。
- 确保您的 P812 缓存偏差设置为 75% 写入或更大。
- 如果这是没有 SAN 的独立 ESXi 主机,ESXi 不应在 USB 或 SDHC 上运行。