作为免责声明 - 我不是存储专家,所以 ELI5 ;) 我正在查看具有直接连接存储的 ESXi(RAID1 中的 SAS SSD 和 HDD,不同的数据存储)。图形上显示的系统 X 位于 HDD RAID 上,另一个(系统 Z)位于 SSD 上。
ESXi 的延迟图 - System X
ESXi 的延迟图 - System Z
两个系统都使用数据库(以及其他东西)。系统 X(如图所示)从系统 Z(Postgres)查询数据,部分导入并显示。如您所见,这里的延迟相当高。此外,我只能看到系统 X 的吞吐量很低。系统 X 经常锁定数据库。
两个系统都拥有大量的 CPU 和 RAM,我所能看到的只是磁盘性能问题。
没有任何附加信息 - 延迟似乎很疯狂,对吗?我的第一个建议是将系统分离到专用数据存储(以及底层磁盘),因为它们都往往具有非常高的 IOPS 要求。
不幸的是,我没有那么多细节,但我正在寻找一些最终可以问的好问题。我计划研究文件系统和挂载选项、磁盘配置(thin/thick),也许用 dd/hdparm/fio 做一些测试。检查我们是否在 RAID 上有写回功能。我还应该检查什么?
谢谢,MMF