如何最佳地调整 Dell PowerVault MD3600i SAN/Initiators 以获得最佳性能？

Question 1

根据您的评论和编辑，您的瓶颈可能是存储。首先，假设您已启用写入缓存，在缓存已满之前，所有写入操作都应以线速完成。您可以通过确定缓存量并使用比缓存量更少的数据执行 100% 写入基准测试来轻松测量这一点。其次，一旦缓存开始将数据转储到磁盘，RAID-10 上的写入性能（假设控制器没有引入瓶颈）将是读取性能的一半。这是因为每次写入都是对两个磁盘进行的，但读取仅从一个磁盘进行。RAID-10 的一个好处是无需计算奇偶校验，因此控制器的处理器不太可能无法跟上。

接下来，如果您的基准测试是测量读取和写入的混合，那么您从存储控制器获得的性能将取决于 IO 的类型。如果是连续的，您将获得更高的 MB/s 数，但 IO/s 数会更低。如果是随机小块，您将获得较低的 MB/s 数，但 IO/s 数与磁盘可以提供的数相同。当您不可预测地读取时，每个 7200 RPM 磁盘都会提供一定数量的 IO/s，因此 raid 中的驱动器数乘以每个驱动器的 IO/s 数将是您的理论性能上限。

最后，如果您将所有存储放在一个大卷中，并将其显示为单个 LUN，则命令队列可能会饱和。常规操作系统具有可配置的命令队列深度（它们将为存储排队的未完成 IO 数量），并且每个卷/LUN 都有自己的队列。将所有存储放在同一个 LUN 中的另一个问题是，通常，IO 会被发送到该 LUN 的单个控制器。即使在主动/主动存储系统上（我不确定您的系统是否如此），它们也可能对一个控制器比另一个控制器具有亲和性。目标是创建一堆卷并将它们均匀地分配给控制器。

Answer

根据您的评论和编辑，您的瓶颈可能是存储。首先，假设您已启用写入缓存，在缓存已满之前，所有写入操作都应以线速完成。您可以通过确定缓存量并使用比缓存量更少的数据执行 100% 写入基准测试来轻松测量这一点。其次，一旦缓存开始将数据转储到磁盘，RAID-10 上的写入性能（假设控制器没有引入瓶颈）将是读取性能的一半。这是因为每次写入都是对两个磁盘进行的，但读取仅从一个磁盘进行。RAID-10 的一个好处是无需计算奇偶校验，因此控制器的处理器不太可能无法跟上。

接下来，如果您的基准测试是测量读取和写入的混合，那么您从存储控制器获得的性能将取决于 IO 的类型。如果是连续的，您将获得更高的 MB/s 数，但 IO/s 数会更低。如果是随机小块，您将获得较低的 MB/s 数，但 IO/s 数与磁盘可以提供的数相同。当您不可预测地读取时，每个 7200 RPM 磁盘都会提供一定数量的 IO/s，因此 raid 中的驱动器数乘以每个驱动器的 IO/s 数将是您的理论性能上限。

最后，如果您将所有存储放在一个大卷中，并将其显示为单个 LUN，则命令队列可能会饱和。常规操作系统具有可配置的命令队列深度（它们将为存储排队的未完成 IO 数量），并且每个卷/LUN 都有自己的队列。将所有存储放在同一个 LUN 中的另一个问题是，通常，IO 会被发送到该 LUN 的单个控制器。即使在主动/主动存储系统上（我不确定您的系统是否如此），它们也可能对一个控制器比另一个控制器具有亲和性。目标是创建一堆卷并将它们均匀地分配给控制器。

Question 2

使用单个磁盘进行基准测试，然后对 raid 0 中的所有磁盘再次执行该操作。

Raid 0 不会有任何 raid10 或 raid 5 开销。

另外，请查看 MD 上的缓存。默认值为 4k 块，但最高可达 32k 块。我发现这两个值之间的速度差异高达 30%。不过，请针对您的工作负载进行测试。

使用 SQLIO 之类的东西，可以使用更多线程。我更加努力后，我的数字终于开始看起来不错了。

并验证 MD 是否配置为 10G。端口上的选项是 10G 或 1G，它不会自动协商。

Answer