在 Debian 6.0.6 系统中,有 74 个 2TB Toshiba DT01ABA200 驱动器。这些驱动器被标识为运行固件版本 MZ4OAAB0 的 Hitachi HDS5C3020BLE630 驱动器。64 个驱动器通过 HP SAS 扩展卡连接到 LSI 2008 SAS 控制器,另外 5 个驱动器直接连接到主板,4 个驱动器连接到基于 Sil 的 PCI 控制器,最后一个驱动器仅通电,没有连接数据线。控制器 LSI 和 Sil 卡的板载 BIOS 均被禁用,并且 mpt2sas 和 sata_sil 模块已从 Linux debian 2.6.32-5-amd64 #1 SMP Sun Sep 23 10:07:46 UTC 2012 x86_64 GNU/Linux 内核中删除。启动后,使用 /etc/rc.local 中的 modprobe 命令加载 mpt2sas 模块。这 74 个驱动器未分区、未格式化、也未安装。
系统消耗:
- 和0 个驱动器:70.6 - 70.9瓦(开机15分钟后);
- 和74 个驱动器:启动后即为 330 - 360 瓦(相当于空闲状态下每个驱动器 3.5 - 3.9 瓦);
- 和74 个驱动器: 420 - 466 瓦,每次在第15分钟正常运行时间(相当于空闲状态下每个驱动器 4.7 - 5.3W)。
驱动器规格列出读/写功耗为 4.7W,空闲功耗为 3.3W。
功耗增加最有可能发生在 5V 线路上,因为大约 1 分钟后,电源 (PSU) 的“过流保护”(OCP) 会关闭电源。所用的 PSU 是单轨型号,12V 线路上的 OCP > 122A,5V 线路上的 OCP > 55A。
回归:
- 无论驱动器的 APM 值设置为禁用还是 1(最大节能),都没有关系。
- 操作系统未记录 中的读/写活动
/proc/diskstats
。那里的值与 modprobe 操作之后的值相同(28 次读取,0 次写入操作)。 - 无法测试启动主板 BIOS 时发生的情况 - 以排除任何操作系统干预 - 因为运行固件 06/27/12 的 Super Micro X8SI6-F 主板有一个错误,它会在 BIOS 模式下错误地将 +74.0 C CPU 传感器温度读取为“高”,并在 1 分钟后关闭电源。
可能导致驱动读/写活动在所有驱动器上启动后15分钟内以及如何防止它的发生?
答案1
听起来很像驱动器正在进行 SMART 清理(自动离线测试)。
smartctl -a /dev/hdx
应使用以下命令确认配置:
Auto Offline Data Collection: Enabled.
禁用方式:
smartctl --offlineauto=off /dev/hdx
也可能是别的什么...