ispconfig 说我的服务器有 raid 问题。该服务器不是我的,是从托管公司租用的。操作系统安装不是我的事:托管公司做的。
cat /proc/mdstat
Personalities : [raid1]
md0 : active raid1 sda1[2](F) sdb1[1]
312568576 blocks [2/1] [_U]
我对这个问题确实不熟悉,我从来没有遇到过这样的问题。
我猜sda1
是死了。你能帮我现在该怎么做吗(除了我应该打电话给托管公司)?我已经备份了所有重要的东西。
答案1
不要惊慌,这是一个常见且可恢复的错误。您的托管公司设置了一个双磁盘冗余阵列,以防其中一个磁盘发生故障时保护数据。现在发生了此故障。输出表明 sda1 发生故障,并且 RAID1 阵列正在运行,但已降级。
不过,现在你的时间不多了。如果第二个磁盘出现故障,数据就会丢失,你必须从备份中恢复。要求你的托管公司立即更换故障磁盘,并在完成后回复你!
答案2
此外,在弄乱或让别人弄乱降级的 raid 之前确保备份完好无损是个好主意。级联故障很不幸,主机工作人员的错误也是如此(请再三检查,确保您和主机公司的工作人员对要对哪个磁盘做什么达成共识)。
据我所知,如果设备名为 /dev/mdX,则总是linux softraid,因此除了直 SATA 或 SAS 主机适配器之外,不涉及任何硬件存储控制器。
在 Linux 中,有多种方式可以告诉它某个磁盘将被逻辑移除或者已被添加,但是,这些方式仅在热插拔直接连接的 PATA 或并行 SCSI 设备时才是必要的(无论如何,在没有明确支持它的硬件上,这应该被视为禁止的)。
smartctl(来自 smartmontools 包;如果涉及 ssd 并且提供商未在服务器上设置 smartmontools 守护程序或 cron 脚本,则不要运行它;已知某些版本的智能实用程序会损坏某些 ssd)可以告诉您很多有关驱动器问题的信息,尤其是如果直接连接,如本例所示,因此可以调用 dmesg。您获得的替换磁盘上的 spinup_count 和 power_on_hours 值有时会成为与托管商的有趣讨论话题 ;)