家用服务器硬盘:325 天内 186k 次启停循环?

家用服务器硬盘:325 天内 186k 次启停循环?

大约一年前,我建立了一个家庭服务器,使用 Ubuntu 服务器(目前为 10.04 LTS)、四个 RAID 5 磁盘用于存储(WD Green 1.5 TB)以及一个笔记本电脑驱动器用于操作系统。

smartctl今天,用于检查的命令行实用程序的输出聪明的硬盘属性告诉我,主操作系统驱动器在 325 天内的启动-停止循环次数已不少于 186,000 次,可能已接近其使用寿命的终点。

输出smartctl为“标准值”,在本例中是 200 到 000 之间的数字,其中 200 表示“全新”,000 表示“磨损”。我的磁盘得到 001。

所以我想知道发生了什么:7820 小时内 186k 次启动/停止循环大约是每 2.5 分钟一次启动/停止。对于每天实际使用一两次的计算机来说,这似乎有点过分。(RAID 磁盘正常,平均每天启动/停止一次,正如预期的那样。)

有没有人有类似的经历,或者指出这里可能存在的问题?

具体来说,我想知道

  • 为什么启动/停止次数如此之多?我是不是遇到了某种配置问题?是不是后台服务出了问题?
  • 笔记本电脑磁盘作为操作系统驱动器是否是问题的一部分?有人可以确认或否认这一点吗?

这是 /etc/hdparm.conf 配置

/dev/sda {
  apm = 127
  spindown_time = 120
}

以及最相关的部分smartctl --attributes /dev/sda

smartctl version 5.38 [x86_64-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   001   001   000    Old_age   Always       -       185875
  9 Power_On_Hours          0x0032   090   090   000    Old_age   Always       -       7820
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       109
193 Load_Cycle_Count        0x0032   118   118   000    Old_age   Always       -       246833
194 Temperature_Celsius     0x0022   107   098   000    Old_age   Always       -       36

由于我通常希望我的驱动器能够使用一年以上,因此非常感谢您的任何建议。

更新

显然问题出在 hdparm.com 中的“apm = 127”设置上。注释掉这些设置后,我得到了默认值 254,磁盘根本就无法停止旋转。

这也不是我想要的,我得看看能否找到一个折中方案。不过,这篇文章标题中的问题已经解决了。谢谢你的帮助。

为遇到类似问题的人提供更多详细信息:

apm 是高级电源管理,取值范围为 1-255。值越高表示“性能越好”,值越低表示“更省电”,255 表示“禁用”。

根据 hdparm 手册页,我选择 127 作为“仍然允许磁盘旋转的最高性能”,因为我希望在服务器不使用时磁盘进入睡眠状态。

我遇到的情况是,制造商为这款特定驱动器(WD Scorpio Blue)设置了 20 秒的默认旋转时间,对于使用电池供电的笔记本电脑来说,这是一个足够合理的默认时间。

由于操作系统一直在向磁盘写入数据(系统日志等,无论计算机是否实际使用),磁盘几乎不会进入睡眠状态,然后又被唤醒,并且我得到了每 20 秒启动/停止一次的行为。我尝试增加旋转时间(我将其设置为 10 分钟),但显然被驱动器忽略了。

在某个时候我已经安装了 笔记本模式,它将磁盘读/写缓存在内存中,因此操作系统只需要每隔几个小时写入磁盘一次。

本例中的主要问题是,升级后 laptop-mode 停止工作 - 它仍被列为启动时启动的服务,但不再启动。我几乎忘记了它,也没有想到要检查一下。

至少我现在知道该去哪里找了,再次感谢您的意见。

答案1

要检查的一些事项:

  • 问题现在发生了吗?(对驱动器进行采样,等待一天,再次采样,看看它是否明显增加(比如一天每 2.5 分钟一次)
  • 所有磁盘都存在该问题吗,还是只有一个磁盘存在该问题?
  • 计算机的电源配置是什么?是否省电?是否降低磁盘转速?检查hdparm -Bhdparm -S并阅读手册页以获取有关如何解释数据的信息)

如果问题现在没有发生,我记得曾报告过一个与 Ubuntu 中硬盘反复旋转停止和启动相关的错误,但那可能是很久以前的事了。您可以调查一下,看看是否在升级中修复了它。

如果问题仅仅出在一个磁盘上,你就必须问这个磁盘有什么特殊之处。

如果上述设置不符合您的需求,那么它们可能与问题有关,甚至是罪魁祸首。

答案2

哦耶,问题...

应该管用。

答案3

笔记本电脑驱动器的制造商是什么?它也是 WD 吗,就像 RAID 中的一样?Start_Stop_Count 定义为我在 smartmontools 中看到的驱动器的“主轴启动/停止循环次数”常问问题。不幸的是,我没有大量的驱动器可以与这个进行比较。我的笔记本电脑有一个西部数据驱动器,我也在运行 ubuntu。它已经有好几年的历史了,只有大约 300 个相同的属性。这里可能有很多事情发生。

  1. 显然,不同的制造商报告的数据各不相同(即使是同一制造商的不同品牌)。因此,数字可能意味着与标签所示不同的其他含义。

  2. 笔记本电脑驱动器可能具有内置的省电逻辑,这可能涉及在空闲时停止主轴旋转。

  3. 向智能报告属性的传感器可能已损坏。

  4. 最可能的原因是 Ubuntu 设置为在空闲时降低驱动器转速。你应该看看这个邮政

相关内容