从 /dev/sda 收到大量错误

从 /dev/sda 收到大量错误

我有一台 Asus EeeBox PC - B204(原始规格如下:https://en.wikipedia.org/wiki/Asus_EeeBox_PC)运行 Ubuntu 14.04.5 LTS;唯一改变的是原来的 HDD 改为 Kingston V300 SSD;

到目前为止,一切都很好。但最近我开始收到一些错误,一段时间后系统进入只读模式 - 甚至无法通过 ssh 连接;

因此,我卸下了 SSD,将其连接到另一台计算机,并使用 Hirens Boot CD 运行了一些检测/修复测试;然后,我在 Windows 中使用 Kingston SSD Manager 更新了 SSD 固件;

我将 SSD 安装回我的 Linux 机器上,两天内没有冻结/切换到只读模式,但我得到了很多这样的信息(每 1-2 分钟一次):

[2017 年 3 月 1 日星期三 20:41:03] ata1:丢失中断(状态 0x50)
[2017 年 3 月 1 日星期三 20:41:03] ata1.00:异常 Emask 0x0 SAct 0x0 SErr 0x0 操作 0x6 冻结
[2017 年 3 月 1 日星期三 20:41:03] ata1.00:命令失败:READ DMA
[2017 年 3 月 1 日星期三 20:41:03] ata1.00: cmd c8/00:08:e0:d0:cc/00:00:00:00:00/ec 标签 0 dma 4096
[2017 年 3 月 1 日星期三 20:41:03] res 40/00:01:a0:20:cf/00:00:00:00:00/e0 Emask 0x4(超时)
[2017 年 3 月 1 日星期三 20:41:03] ata1.00:状态:{ DRDY }
[Wed Mar 1 20:41:03 2017] ata1:软重置链接
[2017 年 3 月 1 日星期三 20:41:03] ata1.00:配置为 UDMA/33
[2017 年 3 月 1 日星期三 20:41:03] ata1:EH 完成

有什么办法可以确定问题所在吗?是我的 SSD 坏了?还是我的 SATA 控制器坏了?

smartctl -a /dev/sda回报

smartctl 6.2 2013-07-26 r3841 [i686-linux-4.4.0-64-generic](本地构建)
版权所有 (C) 2002-13,Bruce Allen、Christian Franke,www.smartmontools.org

信息部分的开始
型号系列:SandForce 驱动 SSD
设备型号:KINGSTON SV300S37A120G
序列号:50026B785201EA6B
LU WWN 设备 ID:5 0026b7 85201ea6b
固件版本:60AABBF0
用户容量:120,033,041,920 字节 [120 GB]
扇区大小:512 字节逻辑/物理
转速:固态设备
设备是:在 smartctl 数据库中[详细信息使用:-P show]
ATA 版本为:ATA8-ACS、ACS-2 T13/2015-D 修订版 3
SATA 版本为:SATA 3.0、6.0 Gb/s(当前:1.5 Gb/s)
当地时间是: 2017 年 EET 3 月 1 日星期三 21:35:08
SMART 支持: 可用 - 设备具有 SMART 功能。
SMART 支持为:已启用
 读取智能数据部分的开始
SMART整体健康自我评估测试结果:通过

一般 SMART 价值观:
离线数据收集状态:(0x05) 离线数据收集活动
                                        被主机的中断命令中止。
                                        自动离线数据收集:禁用。
自检执行状态:( 33) 自检程序被中断
                                        由主机通过硬或软重置。
离线完成的总时间
数据收集:(0)秒。
离线数据采集
功能:(0x7d) SMART 立即离线执行。
                                        不支持自动离线数据收集。
                                        新的时中止离线收集
                                        命令。
                                        支持离线表面扫描。
                                        支持自检。
                                        支持传送自检。
                                        支持选择性自检。
SMART 功能:(0x0003) 在输入之前保存 SMART 数据
                                        省电模式。
                                        支持SMART自动保存定时器。
错误记录功能:(0x01) 支持错误记录。
                                        支持通用日志记录。
简短的自检程序
建议轮询时间:(1)分钟。
扩展自检程序
建议投票时间:(48)分钟。
输送自检程序
建议轮询时间:(2)分钟。
SCT 功能:(0x0025) 支持 SCT 状态。
                                        支持 SCT 数据表。

SMART 属性数据结构修订号:10
具有阈值的供应商特定 SMART 属性:
ID# ATTRIBUTE_NAME 标志值 最差阈值类型已更新 WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x0032 095 095 050 Old_age 始终 - 2/22219071
  5 Retired_Block_Count 0x0033 100 100 003 预失败始终 - 0
  9 Power_On_Hours_and_Msec 0x0032 095 095 000 Old_age 始终 - 4408h+22m+17.710s
 12 Power_Cycle_Count 0x0032 100 100 000 Old_age 始终 - 659
171 Program_Fail_Count 0x000a 100 100 000 Old_age 始终 - 0
172 Erase_Fail_Count 0x0032 100 100 000 Old_age 始终 - 0
174 Unexpect_Power_Loss_Ct 0x0030 000 000 000 Old_age 离线 - 69
177 Wear_Range_Delta 0x0000 000 000 000 Old_age 离线 - 99
181 Program_Fail_Count 0x000a 100 100 000 Old_age 始终 - 0
182 Erase_Fail_Count 0x0032 100 100 000 Old_age 始终 - 0
187 报告的不正确 0x0012 100 100 000 Old_age 始终 - 0
189 Airflow_Temperature_Cel 0x0000 041 048 000 Old_age 离线 - 41(最小/最大 19/48)
194Temperature_Celsius 0x0022 041 048 000 Old_age 始终 - 41(最小/最大 19/48)
195 ECC_Uncorr_Error_Count 0x001c 105 105 000 Old_age 离线 - 2/22219071
196 Realated_Event_Count 0x0033 100 100 003 预失败始终 - 0
201 Unc_Soft_Read_Err_Rate 0x001c 105 105 000 Old_age 离线 - 2/22219071
204 Soft_ECC_Correct_Rate 0x001c 105 105 000 Old_age 离线 - 2/22219071
230 Life_Curve_Status 0x0013 100 100 000 故障前始终 - 100
231 SSD_Life_Left 0x0013 099 099 010 预故障始终 - 1
233 SandForce_Internal 0x0032 000 000 000 Old_age 始终 - 2924
234 SandForce_Internal 0x0032 000 000 000 Old_age 始终 - 2142
241 Lifetime_Writes_GiB 0x0032 000 000 000 Old_age 始终 - 2142
242 Lifetime_Reads_GiB 0x0032 000 000 000 Old_age 始终 - 4201

不支持 SMART 错误日志

SMART 自检日志结构修订号 1
Num Test_Description 状态 剩余寿命(小时) LBA_of_first_error
# 1 延长离线中断(主机复位) 10% 4327 -
# 2 延长离线中断(主机复位) 90% 4314 -
# 3 延长离线中断(主机复位) 10% 4312 -
# 4 短暂离线 已完成且无错误 00% 10 -

SMART 选择性自检日志数据结构修订号 1
 跨度 MIN_LBA MAX_LBA CURRENT_TEST_STATUS
    1 0 0 未测试
    2 0 0 未测试
    3 0 0 未测试
    4 0 0 未测试
    5 0 0 未测试
选择性自检标志 (0x0):
  扫描选定的跨度后,请勿读取扫描磁盘的其余部分。
如果选择性自检在加电时等待,请在 0 分钟延迟后恢复。

谢谢。

相关内容