Ubuntu 13.04。我的 SSD 上的坏扇区数量一直在稳步增加,今天已经达到 226 个坏扇区。
问题是,我不知道 226 个坏扇区是 SSD 的 0.0001%、1% 还是 99%。
今天早上我在网上没有找到任何可以回答这个问题的东西。
这磁盘实用程序也没有告诉我,而且我无法在 SMART 数据中找到该信息。
sudo smartctl -a /dev/sda
显示如下:
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-3.8.0-31-generic] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF INFORMATION SECTION ===
Device Model: Samsung SSD 840 PRO Series
Serial Number: S1ATNEAD645474H
LU WWN Device Id: 5 002538 5503c15c0
Firmware Version: DXM05B0Q
User Capacity: 256,060,514,304 bytes [256 GB]
Sector Size: 512 bytes logical/physical
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: 8
ATA Standard is: ATA-8-ACS revision 4c
Local Time is: Fri Jan 24 20:37:08 2014 CST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (53956) seconds.
Offline data collection
capabilities: (0x53) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
No Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 20) minutes.
SCT capabilities: (0x003d) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.
SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
5 Reallocated_Sector_Ct 0x0033 097 097 010 Pre-fail Always - 238
9 Power_On_Hours 0x0032 099 099 000 Old_age Always - 1331
12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always - 341
177 Wear_Leveling_Count 0x0013 097 097 000 Pre-fail Always - 75
179 Used_Rsvd_Blk_Cnt_Tot 0x0013 097 097 010 Pre-fail Always - 238
181 Program_Fail_Cnt_Total 0x0032 097 097 010 Old_age Always - 238
182 Erase_Fail_Count_Total 0x0032 100 100 010 Old_age Always - 0
183 Runtime_Bad_Block 0x0013 097 097 010 Pre-fail Always - 238
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0032 067 062 000 Old_age Always - 33
195 Hardware_ECC_Recovered 0x001a 200 200 000 Old_age Always - 0
199 UDMA_CRC_Error_Count 0x003e 099 099 000 Old_age Always - 1
235 Unknown_Attribute 0x0012 099 099 000 Old_age Always - 128
241 Total_LBAs_Written 0x0032 099 099 000 Old_age Always - 33308592070
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
255 0 65535 Read_scanning was never started
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
答案1
我们的 SSD 智能数据显示,您使用了 SSD 1331 小时,您的 SSD 遭受了 33308592070*512/1024^4=15,5 TiB 的写入。这意味着您的 SSD 每通电一小时大约有 12 GiB 的写入。对于典型的消费者 SSD 使用来说,这相当多。您将 SSD 用于什么用途?
您仍远低于 SSD 的写入周期限制,SSD 是基于 MLC 的,因此应该可以承受约 3000 次写入周期,这意味着约 256GB*3000=768 TB 的写入量。因此我认为您是安全的。
但是您的 SMART 数据显示,现在您已经有 238 个重新分配(故障)扇区。与您驱动器上的几亿个扇区相比,这个数字仍然非常低,但令我惊讶的是,仅在 60-70 个写入周期后,您的 SSD 就有故障块。您的 SSD 上还有一些备用空间吗?SSD 需要一些备用空间才能有效地管理驱动器上的磨损。如果驱动器几乎已满,由于磨损均衡算法的写入增加,它会磨损得更快。
这里这是显示 840 PRO 256 GB SSD 写入测试的图表。写入 300 TB 后,重新分配扇区仍然为零,或接近于零。写入不到 20 TB 后,重新分配扇区超过 200 个。
您使用的是驱动器的最新固件。我不想让您担心,但我认为您应该联系三星的 SMART 输出,并询问他们的意见。我认为您的驱动器存在某种问题。
更新:
在三星做出回应之后 - 他们基本上说一切都很好 - 我想说,只要你没有遇到数据丢失,(只要在写入操作期间发现坏块)我想你就不必担心。
您可以在运行时坏块行(238,原始值)是程序失败总数(238,表示写入操作失败)总擦除失败次数(0,即失败的擦除操作)和失败的读取操作。因此,在生成智能输出时,驱动器上的失败读取操作是 238-238-0=0,因此您没有任何失败的读取,也没有任何数据丢失。
如果您的驱动器在不久的将来也开始遇到读取失败的情况(这意味着运行时坏块不等于程序失败总数+总擦除失败次数),可能会丢失数据,我会重新联系三星。在那之前,请尽情享受您的 SSD。
答案2
最终,三星 840 Pro SSD 在 2014 年晚些时候出现了灾难性的故障。它被保修期内的三星 850 Pro 替换,自那时起,它一直运行良好,并且仍然没有报告任何坏扇区。我对此感到很高兴,因为我认为这也许是 SSD 的“未记录的功能”。