我觉得很奇怪,在 RAID 1 配置中,一块磁盘的 SMART 温度读数与另一块磁盘的温度读数相差多达9°摄氏度:
# smartctl -d scsi -A /dev/sg1
=== START OF READ SMART DATA SECTION ===
Current Drive Temperature: 34 C
Drive Trip Temperature: 68 C
# smartctl -d scsi -A /dev/sg2
=== START OF READ SMART DATA SECTION ===
Current Drive Temperature: 43 C
Drive Trip Temperature: 68 C
该服务器是 1U Dell PowerEdge R210,规格如下这里. 什么原因造成这种异常?
答案1
这绝不是不正常的。这是我的服务器过去一年的硬盘温度:
它们之间确实存在关联,但其中一个的温度比另一个高 7°C。就我而言,我相当确定这是由于机箱内部的气流差异造成的:其中一个比另一个吸收了更多来自机箱风扇的气流。过去,当我交换它们时,线条只是随之交换(这些数据已从图表中过时,抱歉)。
谷歌关于硬盘故障的著名论文得出的结论是
在中等温度范围内,可能存在其他因素比温度对故障率的影响更大。
因此,只要您经常将温度保持在 45C 以下,就不必过于担心这种差异。
答案2
物理磁盘和/或其附近的风扇的配置是怎样的?
如果驱动器在狭窄的空间内相互叠放,则完全有可能看到很大的变化范围。
我会查看物理设计来寻找答案。