如何知道 RAID 5 上是否有一个磁盘出现故障?

如何知道 RAID 5 上是否有一个磁盘出现故障?

我在 RAID 5 上配置了 4 x 8TB,因为如果一个磁盘发生故障,系统可以存活。但是如果超过 1 个磁盘发生故障,系统将被破坏。我如何检查一个磁盘是否已经发生故障,以便我可以备份?

这并没有传递以下信息:

fdisk -l

答案1

RAID 托管在哪个系统中?大多数现代 NAS(我操作过 Synology 和 QNAP)都具有内置的通知渠道和策略,可随时使用,并考虑各种事件,磁盘故障是最常见的事件之一。所有这些都通过 NAS 的 GUI 进行。更一般地说(包括这些基于 Linux 的机器的 NAS),通过命令行调查磁盘状态的一个候选方法是 smartctl,它将为您提供有关磁盘 SMART 状态的详细信息。您应该在这里找到足够的详细信息(尤其是关于如何安装它(如果尚未安装)的信息):https://www.smartmontools.org

获得它后,您首先可以检查磁盘是否支持 SMART(再次强调,大多数现代主流磁盘都支持)。这是我的 Synology 盒子中的一个磁盘:

$ sudo smartctl -i /dev/sda
Password: 
smartctl 6.5 (build date Mar 30 2020) [x86_64-linux-3.10.105] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Iron Wolf PRO
Device Model:     ST4000NE001-2MA101
Serial Number:    XXXXXXX
LU WWN Device Id: 5 000c50 0cbe3d8cb
Firmware Version: EN01
User Capacity:    4,000,787,030,016 bytes [4.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   Unknown(0x0fe0) (minor revision not indicated)
SATA Version is:  SATA >3.2 (0x1ff), 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Fri Mar  5 14:56:21 2021 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

如您所见,此磁盘中的 SMART 可用且已启用。如果未启用,smartctl 可以尝试启用它(使用 -s 或 --smart 选项)。这样可以确保您可以快速浏览磁盘的状态:

$ sudo smartctl -H /dev/sda
smartctl 6.5 (build date Mar 30 2020) [x86_64-linux-3.10.105] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

这告诉我磁盘状况良好。然后,您可以使用 smartctl 进行更详细的分析,并收集有关磁盘支持的每个单个 SMART 指示器的详细信息(并非所有磁盘都支持同一套,即使在同一制造商和同一系列的磁盘中也是如此)。

相关内容