今天早些时候,我收到了一封来自mdadm 监控内容如下:
This is an automatically generated mail message from mdadm
running on server
This is an automatically generated mail message from mdadm
running on server
A Fail event had been detected on md device /dev/md127.
It could be related to component device /dev/sdd1.
Faithfully yours, etc.
P.S. The /proc/mdstat file currently contains the following:
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10]
md127 : active raid10 sda1[0] sdc1[2] sdd1[3](F) sdb1[1]
5860267008 blocks super 1.2 512K chunks 2 near-copies [4/3] [UUU_]
[==========>..........] check = 50.9% (2983082496/5860267008) finish=1025.1min speed=46774K/sec
unused devices: <none>
我刚刚登录服务器并运行cat /proc/mdstat
,结果如下:
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10]
md127 : active raid10 sda1[0] sdb1[1] sdc1[2]
5860267008 blocks super 1.2 512K chunks 2 near-copies [4/3] [UUU_]
unused devices: <none>
我理解得对吗?驱动器出现故障了吗?
答案1
您有 512E 磁盘sdd
。这意味着您可能遇到一些未知问题,例如旧 BIOS、旧 SATA 控制器或旧 OS 驱动程序。此磁盘的 SMART 数据显示运行状况良好。sdd
磁盘很好!
为什么被标记为失败?我认为有很多原因:
功率更低。只需安装新的更高功率的供电装置即可。此磁盘在高负载下最多可消耗 20W 的功率。
禁用服务器电源管理。也对您的磁盘执行此操作。或设置最大性能。禁用 OS 电源服务,例如
powerd
、cpuspeed
等。旧的 SATA 控制器在高负载下可能会工作不正常。尝试更新 BIOS。如果这没有帮助,请安装新的 SATA 控制器(可正确支持
4K
磁盘512E
)或更换主板。
另一种方法 - 仅使用512n
旧型号的磁盘。它们的容量高达 4Tb。
答案2
是的,sdd1 失败了。
摘自原始电子邮件
md127 :活动 raid10 sda1[0] sdc1[2]sdd1[3](女)sdb1[1] 5860267008 块 超级 1.2 512K 块 2 个近副本[4/3][呜呜呜]
从你的观察来看
md127 : 活动 raid10 sda1[0] sdb1[1] sdc1[2] 5860267008 块超级 1.2 512K 块 2 个近副本[4/3][呜呜呜]
理想情况下,您的阵列应该有 4 个设备,但实际上只有 3 个。