当在磁盘的所有者节点上运行 diskspd 测试时,CSV_REFS 表现良好。当在 4 节点集群中的任何其他节点上运行测试时,64k 块的延迟会增加 35 倍。我可以切换所有者节点并在新所有者上运行测试,我将继续获得良好的性能。当我从非磁盘所有者运行测试时,结果很差。无论在哪个节点运行,CSV_NTFS 的表现都很好。由于这个观察,我正在考虑放弃 CSV_REFS 而使用 CSV_NTFS。
我正在运行 Windows Server 2019。
我曾考虑过 RDMA 可能是问题所在,但我找不到任何证据表明我遇到了 RDMA 问题。日志很干净,test-rdma.ps1 运行良好。
有人知道为什么会发生这种情况吗?
答案1
这是设计使然。ReFS 始终处于重定向模式。请参阅:
https://learn.microsoft.com/en-us/windows-server/failover-clustering/failover-cluster-csvs
“群集共享卷 (CSV) 使 Windows Server 故障转移群集或 Azure Stack HCI 中的多个节点能够同时对配置为 NTFS 卷的同一 LUN(磁盘)进行读写访问。该磁盘可以配置为弹性文件系统 (ReFS);但是,CSV 驱动器将处于重定向模式这意味着写访问权限将被发送到协调器节点。”