大约一年前,我建立了一个家庭服务器,使用 Ubuntu 服务器(目前为 10.04 LTS)、四个 RAID 5 磁盘用于存储(WD Green 1.5 TB)以及一个笔记本电脑驱动器用于操作系统。
smartctl
今天,用于检查的命令行实用程序的输出聪明的硬盘属性告诉我,主操作系统驱动器在 325 天内的启动-停止循环次数已不少于 186,000 次,可能已接近其使用寿命的终点。
输出
smartctl
为“标准值”,在本例中是 200 到 000 之间的数字,其中 200 表示“全新”,000 表示“磨损”。我的磁盘得到 001。
所以我想知道发生了什么:7820 小时内 186k 次启动/停止循环大约是每 2.5 分钟一次启动/停止。对于每天实际使用一两次的计算机来说,这似乎有点过分。(RAID 磁盘正常,平均每天启动/停止一次,正如预期的那样。)
有没有人有类似的经历,或者指出这里可能存在的问题?
具体来说,我想知道
- 为什么启动/停止次数如此之多?我是不是遇到了某种配置问题?是不是后台服务出了问题?
- 笔记本电脑磁盘作为操作系统驱动器是否是问题的一部分?有人可以确认或否认这一点吗?
这是 /etc/hdparm.conf 配置
/dev/sda {
apm = 127
spindown_time = 120
}
以及最相关的部分smartctl --attributes /dev/sda
:
smartctl version 5.38 [x86_64-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 001 001 000 Old_age Always - 185875
9 Power_On_Hours 0x0032 090 090 000 Old_age Always - 7820
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 109
193 Load_Cycle_Count 0x0032 118 118 000 Old_age Always - 246833
194 Temperature_Celsius 0x0022 107 098 000 Old_age Always - 36
由于我通常希望我的驱动器能够使用一年以上,因此非常感谢您的任何建议。
更新
显然问题出在 hdparm.com 中的“apm = 127”设置上。注释掉这些设置后,我得到了默认值 254,磁盘根本就无法停止旋转。
这也不是我想要的,我得看看能否找到一个折中方案。不过,这篇文章标题中的问题已经解决了。谢谢你的帮助。
为遇到类似问题的人提供更多详细信息:
apm 是高级电源管理,取值范围为 1-255。值越高表示“性能越好”,值越低表示“更省电”,255 表示“禁用”。
根据 hdparm 手册页,我选择 127 作为“仍然允许磁盘旋转的最高性能”,因为我希望在服务器不使用时磁盘进入睡眠状态。
我遇到的情况是,制造商为这款特定驱动器(WD Scorpio Blue)设置了 20 秒的默认旋转时间,对于使用电池供电的笔记本电脑来说,这是一个足够合理的默认时间。
由于操作系统一直在向磁盘写入数据(系统日志等,无论计算机是否实际使用),磁盘几乎不会进入睡眠状态,然后又被唤醒,并且我得到了每 20 秒启动/停止一次的行为。我尝试增加旋转时间(我将其设置为 10 分钟),但显然被驱动器忽略了。
在某个时候我已经安装了 笔记本模式,它将磁盘读/写缓存在内存中,因此操作系统只需要每隔几个小时写入磁盘一次。
本例中的主要问题是,升级后 laptop-mode 停止工作 - 它仍被列为启动时启动的服务,但不再启动。我几乎忘记了它,也没有想到要检查一下。
至少我现在知道该去哪里找了,再次感谢您的意见。
答案1
要检查的一些事项:
- 问题现在发生了吗?(对驱动器进行采样,等待一天,再次采样,看看它是否明显增加(比如一天每 2.5 分钟一次)
- 所有磁盘都存在该问题吗,还是只有一个磁盘存在该问题?
- 计算机的电源配置是什么?是否省电?是否降低磁盘转速?检查
hdparm -B
(hdparm -S
并阅读手册页以获取有关如何解释数据的信息)
如果问题现在没有发生,我记得曾报告过一个与 Ubuntu 中硬盘反复旋转停止和启动相关的错误,但那可能是很久以前的事了。您可以调查一下,看看是否在升级中修复了它。
如果问题仅仅出在一个磁盘上,你就必须问这个磁盘有什么特殊之处。
如果上述设置不符合您的需求,那么它们可能与问题有关,甚至是罪魁祸首。
答案2
答案3
笔记本电脑驱动器的制造商是什么?它也是 WD 吗,就像 RAID 中的一样?Start_Stop_Count 定义为我在 smartmontools 中看到的驱动器的“主轴启动/停止循环次数”常问问题。不幸的是,我没有大量的驱动器可以与这个进行比较。我的笔记本电脑有一个西部数据驱动器,我也在运行 ubuntu。它已经有好几年的历史了,只有大约 300 个相同的属性。这里可能有很多事情发生。
显然,不同的制造商报告的数据各不相同(即使是同一制造商的不同品牌)。因此,数字可能意味着与标签所示不同的其他含义。
笔记本电脑驱动器可能具有内置的省电逻辑,这可能涉及在空闲时停止主轴旋转。
向智能报告属性的传感器可能已损坏。
最可能的原因是 Ubuntu 设置为在空闲时降低驱动器转速。你应该看看这个邮政。