如何保证集群机器之间的硬盘速度相同?

如何保证集群机器之间的硬盘速度相同?

我在集群机器上进行实验。每台机器都有完全相同的硬件和软件配置。

实验的运行时间取决于 HDD 的顺序读取速度(100% 磁盘 io 绑定作业)。

我找到

  1. 即使每台机器具有相同的数据字节,它们的运行时间也有很大差异(例如最快和最慢之间的 1.3 ~ 1.8 倍)。
  2. 对于使用不同数据文件的每次运行,最慢和最快的机器都会发生变化。但对于相同的数据文件,结果是可重复的。
  3. 当我用SSD进行同样的实验时,问题就全部消失了。大多数机器几乎同时终止。

我进行了仅读取计算机磁盘中存储的数据文件的实验(使用“fio”磁盘基准测试工具)。结果是一样的。

我的理论是,当数据文件存储在每台机器的硬盘中时,它们存储在不同的磁盘扇区中。磁盘柱面的外部部分可以比它们的内部部分具有更高的顺序扫描速度。 (http://www.tldp.org/LDP/sag/html/hard-disk.html,http://www.pcguide.com/ref/hdd/geom/tracksZBR-c.html

有没有办法调整不同的磁盘读取速度,以便我可以用统一的磁盘速度进行实验?

相关内容