我有一台 Synology 1812+ NAS,其中有 8 个 3TB 硬盘,配置为 RAID 5。它运行的是 DSM 4.1。购买它是为了更换 USB 硬盘、整合存储并使用 Time Machine 进行短期 OS X 备份。该设备和硬盘才使用 2 个月。
每隔一周,我就会从两个驱动器中收到 IO 错误。日志中有以下错误:
Read error at internal disk [3] sector 2586312968.
后来
Bad sector at md2 disk3 sector 250049936 has been corrected.
扇区永远不匹配。建议对驱动器运行扩展 SMART 测试。我这样做了,这是我得到的值:
然后,我对其中一个驱动器运行了扩展的 SMART 测试,没有收到任何投诉,以下是我得到的值:
这些值看起来非常相似。我不清楚是否存在问题,如果没有,如果 SMART 测试没有发现任何实际问题,那它还有什么意义呢?那么我应该如何解释这些结果,什么时候我应该知道该更换硬盘了?
答案1
原始数据列通常表示发生的事件数。例如,第一行中的读取错误数。但是,您的数字如此之高,以至于我假设您有一个 Seagate 驱动器,它总是报告异常高的原始错误值(即使硬盘驱动器正常)。
您还可以看到什么 - 状态栏。所有参数都正常,这意味着完全相同 - 您的驱动器通常正常。
正如所写http://www.linuxjournal.com/node/6983/print,VALUE 列显示当前的“标准化值”,该值应该始终大于阈值。
因此,您的 SMART 数据显示所有驱动器都正常。但是,如果您收到大量读取错误(不仅仅是去年日志中发现的一个错误:),则似乎您的驱动器很快就会死掉。出现几个(最多 1-2 千个,请参阅)是“正常”的有多少 SMART 部门重新分配表明存在问题?) 驱动器上的坏扇区将被其他扇区替换,从而得到纠正。但是,如果您收到太多此类消息或它们出现的频率很高,则应该更换驱动器。
您可能可以进行 SMART 测试或其他一些测试(均取决于您的 NAS)...例如,如果您有 smartctl 并且可以通过 ssh 登录 NAS,您可以尝试:
# smartctl -t short /dev/<device>
此命令将对选定的驱动器运行简短测试。完成后,您可以使用以下命令查看结果
# smartctl -H /dev/<device>
# smartctl -l selftest /dev/<device>
答案2
我还有另一个选择您可以尝试,我发现我的 DS1812 有类似的问题,我的朋友的 DS1512 也有类似的问题,如果驱动器是新的并且您收到这些错误,则可能是您在第一次创建卷时驱动器上有几个坏块(顺便说一下,这是正常现象),如果您在创建卷时没有选择检查坏块选项,Synology 会跳过该步骤并且不会真正处理驱动器上的坏块。
因此,您会收到这些错误。假设您的卷可以处理 2 个驱动器故障并继续运行,您可以一次拔出一个坏驱动器,将其他好驱动器与其中一个坏驱动器一起留在 NAS 中,使用 USB 适配器或直接插入驱动器,将刚从 NAS 中拔出的坏驱动器放在另一台计算机上,然后从该计算机检查驱动器的完整性。
如果您有一个 Windows 系统,您可以运行 CHKDSK 或 checkdisk,一旦任务完成,查看是否存在任何问题,如果没有,则使用 NTFS 格式化从 Synology NAS 中取出的坏驱动器并将其放回卷中,当您执行此操作时,您将指示 NAS 修复卷,并且在此阶段,NAS 会将驱动器重新格式化为您在 NAS 上使用的文件系统,同时查找并修复坏块。
第一个驱动器完成并且卷已修复后,对第二个“坏驱动器”重复这些步骤,希望您不会再收到这些 I/O 错误。当我第一次遇到与您遇到的相同 I/O 错误类型的错误时,我想到了这个小技巧,现在一切都好了,当我让我的朋友执行这些步骤时,他的情况也是如此。
祝你好运,我希望这对你有帮助。