我有三台 Dell Poweredge 2950。一台是 5 个磁盘上的 RAID-5,另外两台是 3 个磁盘上的 RAID-5。后两台开始出现性能问题 - IO 延迟非常高。当我检查 RAID 状态时,我发现它们正在对一个磁盘进行巡检读取。此外,没有 SMART 错误或任何类似错误 - 磁盘似乎没问题,但我只使用了一个星期,所以我对此不确定。
巡检读取不应该过多地降低 IO 性能,对吧?但是我不能再使用这些机器了。我重新启动了其中一台,但它无法正确启动,因为它无法完成一些启动作业,而且我花了大约 30 分钟才得到一个 shell。另外,巡检读取大约在 20 小时前开始,所以现在应该已经完成了。
我没有安装 OMSA,所以我对此无能为力,而且我无法安装它,因为 IO 延迟太高了。
我的问题是:
- 为什么巡逻读取会导致我的系统无法使用 - 但只有三台机器中的两台无法使用?
- 为什么巡检读取需要这么长时间?我知道系统重启时巡检读取也会重启。我只重启了一台机器,所以另一台应该及时完成。
- 我该如何解决这个问题?我想我必须以某种方式停止巡逻读取才能做任何有用的事情 - 比如安装管理软件。
编辑:硬盘是戴尔 WD7502ABYS - 所以它们是企业级磁盘。
答案1
这很奇怪:巡逻读取应该只在磁盘空闲时工作。
我强烈怀疑这里还有其他因素在起作用。您使用的是台式机级磁盘吗?也许一个或多个磁盘存在读取问题,并且读取负载会导致固件相关超时(即使用没有 TLER 或类似功能的磁盘时)。
您能发布控制器和磁盘的规格和详细信息吗?