我有一台 Asus EeeBox PC - B204(原始规格如下:https://en.wikipedia.org/wiki/Asus_EeeBox_PC)运行 Ubuntu 14.04.5 LTS;唯一改变的是原来的 HDD 改为 Kingston V300 SSD;
到目前为止,一切都很好。但最近我开始收到一些错误,一段时间后系统进入只读模式 - 甚至无法通过 ssh 连接;
因此,我卸下了 SSD,将其连接到另一台计算机,并使用 Hirens Boot CD 运行了一些检测/修复测试;然后,我在 Windows 中使用 Kingston SSD Manager 更新了 SSD 固件;
我将 SSD 安装回我的 Linux 机器上,两天内没有冻结/切换到只读模式,但我得到了很多这样的信息(每 1-2 分钟一次):
[2017 年 3 月 1 日星期三 20:41:03] ata1:丢失中断(状态 0x50) [2017 年 3 月 1 日星期三 20:41:03] ata1.00:异常 Emask 0x0 SAct 0x0 SErr 0x0 操作 0x6 冻结 [2017 年 3 月 1 日星期三 20:41:03] ata1.00:命令失败:READ DMA [2017 年 3 月 1 日星期三 20:41:03] ata1.00: cmd c8/00:08:e0:d0:cc/00:00:00:00:00/ec 标签 0 dma 4096 [2017 年 3 月 1 日星期三 20:41:03] res 40/00:01:a0:20:cf/00:00:00:00:00/e0 Emask 0x4(超时) [2017 年 3 月 1 日星期三 20:41:03] ata1.00:状态:{ DRDY } [Wed Mar 1 20:41:03 2017] ata1:软重置链接 [2017 年 3 月 1 日星期三 20:41:03] ata1.00:配置为 UDMA/33 [2017 年 3 月 1 日星期三 20:41:03] ata1:EH 完成
有什么办法可以确定问题所在吗?是我的 SSD 坏了?还是我的 SATA 控制器坏了?
smartctl -a /dev/sda
回报
smartctl 6.2 2013-07-26 r3841 [i686-linux-4.4.0-64-generic](本地构建) 版权所有 (C) 2002-13,Bruce Allen、Christian Franke,www.smartmontools.org 信息部分的开始 型号系列:SandForce 驱动 SSD 设备型号:KINGSTON SV300S37A120G 序列号:50026B785201EA6B LU WWN 设备 ID:5 0026b7 85201ea6b 固件版本:60AABBF0 用户容量:120,033,041,920 字节 [120 GB] 扇区大小:512 字节逻辑/物理 转速:固态设备 设备是:在 smartctl 数据库中[详细信息使用:-P show] ATA 版本为:ATA8-ACS、ACS-2 T13/2015-D 修订版 3 SATA 版本为:SATA 3.0、6.0 Gb/s(当前:1.5 Gb/s) 当地时间是: 2017 年 EET 3 月 1 日星期三 21:35:08 SMART 支持: 可用 - 设备具有 SMART 功能。 SMART 支持为:已启用 读取智能数据部分的开始 SMART整体健康自我评估测试结果:通过 一般 SMART 价值观: 离线数据收集状态:(0x05) 离线数据收集活动 被主机的中断命令中止。 自动离线数据收集:禁用。 自检执行状态:( 33) 自检程序被中断 由主机通过硬或软重置。 离线完成的总时间 数据收集:(0)秒。 离线数据采集 功能:(0x7d) SMART 立即离线执行。 不支持自动离线数据收集。 新的时中止离线收集 命令。 支持离线表面扫描。 支持自检。 支持传送自检。 支持选择性自检。 SMART 功能:(0x0003) 在输入之前保存 SMART 数据 省电模式。 支持SMART自动保存定时器。 错误记录功能:(0x01) 支持错误记录。 支持通用日志记录。 简短的自检程序 建议轮询时间:(1)分钟。 扩展自检程序 建议投票时间:(48)分钟。 输送自检程序 建议轮询时间:(2)分钟。 SCT 功能:(0x0025) 支持 SCT 状态。 支持 SCT 数据表。 SMART 属性数据结构修订号:10 具有阈值的供应商特定 SMART 属性: ID# ATTRIBUTE_NAME 标志值 最差阈值类型已更新 WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x0032 095 095 050 Old_age 始终 - 2/22219071 5 Retired_Block_Count 0x0033 100 100 003 预失败始终 - 0 9 Power_On_Hours_and_Msec 0x0032 095 095 000 Old_age 始终 - 4408h+22m+17.710s 12 Power_Cycle_Count 0x0032 100 100 000 Old_age 始终 - 659 171 Program_Fail_Count 0x000a 100 100 000 Old_age 始终 - 0 172 Erase_Fail_Count 0x0032 100 100 000 Old_age 始终 - 0 174 Unexpect_Power_Loss_Ct 0x0030 000 000 000 Old_age 离线 - 69 177 Wear_Range_Delta 0x0000 000 000 000 Old_age 离线 - 99 181 Program_Fail_Count 0x000a 100 100 000 Old_age 始终 - 0 182 Erase_Fail_Count 0x0032 100 100 000 Old_age 始终 - 0 187 报告的不正确 0x0012 100 100 000 Old_age 始终 - 0 189 Airflow_Temperature_Cel 0x0000 041 048 000 Old_age 离线 - 41(最小/最大 19/48) 194Temperature_Celsius 0x0022 041 048 000 Old_age 始终 - 41(最小/最大 19/48) 195 ECC_Uncorr_Error_Count 0x001c 105 105 000 Old_age 离线 - 2/22219071 196 Realated_Event_Count 0x0033 100 100 003 预失败始终 - 0 201 Unc_Soft_Read_Err_Rate 0x001c 105 105 000 Old_age 离线 - 2/22219071 204 Soft_ECC_Correct_Rate 0x001c 105 105 000 Old_age 离线 - 2/22219071 230 Life_Curve_Status 0x0013 100 100 000 故障前始终 - 100 231 SSD_Life_Left 0x0013 099 099 010 预故障始终 - 1 233 SandForce_Internal 0x0032 000 000 000 Old_age 始终 - 2924 234 SandForce_Internal 0x0032 000 000 000 Old_age 始终 - 2142 241 Lifetime_Writes_GiB 0x0032 000 000 000 Old_age 始终 - 2142 242 Lifetime_Reads_GiB 0x0032 000 000 000 Old_age 始终 - 4201 不支持 SMART 错误日志 SMART 自检日志结构修订号 1 Num Test_Description 状态 剩余寿命(小时) LBA_of_first_error # 1 延长离线中断(主机复位) 10% 4327 - # 2 延长离线中断(主机复位) 90% 4314 - # 3 延长离线中断(主机复位) 10% 4312 - # 4 短暂离线 已完成且无错误 00% 10 - SMART 选择性自检日志数据结构修订号 1 跨度 MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 未测试 2 0 0 未测试 3 0 0 未测试 4 0 0 未测试 5 0 0 未测试 选择性自检标志 (0x0): 扫描选定的跨度后,请勿读取扫描磁盘的其余部分。 如果选择性自检在加电时等待,请在 0 分钟延迟后恢复。
谢谢。