我的 SAN 存在性能问题。我有一个完整的 10Gbps 专用网络设置。我有以下设置
1 - 通过光纤收发器 10GbE 连接的 Mac
1 - 具有 10GbE 的 Windows 7 PC
1 - 所有端口均为 10GbE 的 HP 交换机
2 - 具有 10GbE 的 Quantum StorNext 服务器
1 - 具有 2 个控制器以 10GbE 连接到网络的 Dell Compellent 解决方案
所有服务器、交换机和计算机都具有静态分配的 IP
Compellent Config
第 1 层 - RAID 10 中的 10K SAS 驱动器
第 2 层 - RAID6 中的 7200 SAS 驱动器(每组 12 个驱动器,每个组 13 个驱动器)
附加信息
Windows 7 客户端 TCP 卸载选项
IPv4 校验和卸载 - 已启用
TCP 校验和卸载 - 已启用
UDP 校验和卸载 - 已启用
大型发送卸载 - 已启用
巨型数据包 - 已启用 9014 字节
我在 Windows 7 PC 和 Lion Workstation 上安装了 StorNext 卷。不幸的是,我的所有传输速度都在 2Gbps 或 2.8Gbps 左右(如果我真的很幸运的话)。我希望从此设置中获得至少 5Gbps 的速度,但我在文件复制时的平均传输速率约为 2Gbps 或略高于 250MBps。当我将 LUN 直接映射到盒子,然后使用 MAC 上的 HFS(带日志功能)或 Windows 7 PC 上的 NTFS 对其进行本机格式化,然后复制文件时,我得到的速度约为 180MBps。因此,我在直接映射的 LUN 上的性能比我的 StorNext 卷慢。有什么建议吗?有人见过 10GbE 的 iSCSI 性能下降吗?任何帮助都将非常有帮助!谢谢!
答案1
1.) 如果您看到中断流量占用大量处理器负载,则 Jumbos 可能会有所帮助,但如果 TCP 运行正常,它应该能够在 10G 链路上超过 2G。我见过许多 10GE 链路在没有启用 jumbos 的情况下运行率超过 90%。
2.) 如果您确实使用巨型帧,请在 VLAN 和/或广播域中的每个 NIC 和每个交换机端口上启用相同的大小。当数据包跨路由器时,PMTU 会起作用,而在同一网络内混合 MTU 值只会带来麻烦。
3.) 我对 Procurve 设备不是特别熟悉,但如果对缓冲区可用性有任何疑问,TCP 流量在高速下可能会很棘手。我见过其他测试,其中表现为(没有明显的 TCP 丢失)性能大幅下降,最终通过实际减少缓冲区大小来解决。
4.) 确保实际的 TCP 设置(1323、SACK 等)都配置一致。所涉及的操作系统应该开箱即用,但我对存储节点了解不多。可能值得深入研究 - 无论是在设备上的设置方面,还是通过协议跟踪(wireshark 或 tcpdump)来观察窗口大小和正在进行的任何重新传输。
5.) 尝试消除尽可能多的变量 - 甚至消除存储节点和单个工作站之间的交叉电缆 - 以进一步隔离问题。不要害怕禁用您提到的一些卸载功能,因为它们有时会引发问题。
答案2
如果您使用的是 1500 MTU,建议 1,使用 ~9000 的巨型帧/数据包。看起来您确实在某种程度上启用了巨型数据包(基于“巨型数据包 - 已启用 9014 字节”),因此您也有可能正在处理碎片化的数据包。确保您路径上的所有内容都设置为允许 9014 字节数据包。
答案3
这不是您想要的答案,但我们的 Compellent SAN 在性能方面令人失望。我也有过类似的性能数据(在我被问到这个问题之前……这是在使用巨型帧的专用 10G iSCSI 交换机上,所有内容都经过了 CoPilot 和戴尔的“Tiger Team”的验证。我们的其他 SAN(EMC 和许多 Equallogics)具有同样出色的性能)。让我们摆脱这一特定性能瓶颈的方法是更换故障控制器。
你让副驾驶检查过配置了吗?如果设置正确,SAN 无论如何都会报告回家,而且他们可能已经标记了。
这些客户端机器的接口速度是多少?有什么有趣的网络设置吗?驱动程序是最新的吗?在进行传输测试时,资源监视器中的 CPU/内存是什么样的?
答案4
如果你担心网络性能,请尝试防火墙测试计算机之间的网络速度;这将有助于排除网络相关的问题。
您是否考虑过完全禁用巨型帧?