RAID 重建期间文件系统性能下降

RAID 重建期间文件系统性能下降

所以快速提问 - 我们的 RAID6 阵列当前正在重建,并且文件系统性能受到非常明显的影响(主目录以 NFS 形式安装在阵列上)。

我有点预料到,考虑到你正在重建阵列,因此控制器的读/写负担很大,我突然意识到,我真的没有任何东西可以与此相比。

在 RAID 重建期间以及繁重的读/写使用期间(备份期间以及当用户通过 FTP 下载大型 [多 GB] 文件时,性能会受到明显影响),是否看到了严重的(经常出现 5-10 秒冻结)预期行为。

对此有任何想法,我们将不胜感激。这是在本地 NFS 上安装的 40TB 阵列上的硬件 RAID6(LSI 9266-i8)(即服务器在物理上非常靠近工作站)。

答案1

首先,这里有一个概述重建时间的宝贵资源。

RAID 重建以及其在故障前后的工作方式。

现在,就我对重建的想法而言,我们确实知道重建会导致一些非常缓慢的性能,这是理所当然的。正如您将从上面的链接中看到的那样,RAID 重建不仅会将信息从故障磁盘提取到已知的良好磁盘(在发生故障后重建的情况下),还会在服务器运行时将信息写入系统驱动器以及其他数据/辅助驱动器。另一件需要记住的事情是,您通常看到的常规功能不需要花费任何时间,而且资源相对较少,但现在却比平时占用了更多的资源,并给已经负担过重的服务器带来了负担。如果发生预重建故障(性能略有改善,但不会好太多),您可能会很幸运,在最终用户(希望您作为 SA 应该有某种警报系统,这样您就不会对此感到惊讶)甚至不知道出现了任何问题之前,RAID 就会重建。

您看到的 5-10 秒的冻结绝对是正常的,特别是如果您正在重建的服务器是任何类型的数据库服务器,默认情况下该服务器具有比平常更高的写入和读取量(即,包含最终用户全天访问的数据库的 SQL 服务器;我曾经为其提供咨询的一家物业管理公司有一个程序,它全天访问他们的租户记录以查看和写入新信息,并且该程序总是使用率很高。)它会更加明显。

我建议的另一件事是获取控制器附带的 RAID 实用程序(GUI 版本)并将其安装在操作系统上,这样您就可以监控重建,而无需加载到控制器 BIOS 中。

如今,一个非常小且几乎不存在的问题是 NFS 与 iSCSI。我知道您正在使用 NFS,过去在虚拟化的情况下,iSCSI 的整体性能会更好,但随着虚拟机管理程序和硬盘以及控制器的最新改进,NFS 的性能几乎与 iSCSI 相同,因此听起来您有一个非常好的 SAN。

我很乐意回答您需要知道的任何其他问题,因此请随时发表评论。

相关内容