当 ATA 停止响应时，md RAID 中的设备发生故障

Question

德尔蒂克，您误解了 Linux 软件 RAID（md）的工作原理。

md由多个设备或分区构成虚拟块设备，并且不知道您正在向虚拟设备传输什么数据。
您希望它能够完成它没有被设计做的事情。

答案

`md`1. 为什么无响应的驱动器/分区不会失败？

这是因为md不知道

驱动器正忙于处理其md自身请求的 I/O 或
由于某些外部情况（如驱动器自身的错误恢复或 ATA 安全擦除），驱动器被阻止，

因此md将等待驱动器返回什么。驱动器最终没有返回任何读取或写入错误。如果存在读取错误，md则会自动从奇偶校验中修复它，如果存在写入错误，md则会导致设备故障（请参阅md手册页）。

由于没有读取错误也没有写入错误，因此md内核等待其响应后继续使用该设备。

2. 当驱动器被阻止时，我可以从阵列中删除驱动器/分区吗？

不可以。RAID/dev/md0设备已被阻止，除非清除阻止，否则无法修改。

您已将-f或--fail标志传递给mdadm“管理”模式。
以下是其实际作用的演示：

这是该标志工作原理的源代码：

case 'f': /* set faulty */
    /* FIXME check current member */
    if ((sysfd >= 0 && write(sysfd, "faulty", 6) != 6) ||
        (sysfd < 0 && ioctl(fd, SET_DISK_FAULTY,
                rdev))) {
        if (errno == EBUSY)
            busy = 1;
        pr_err("set device faulty failed for %s:  %s\n",
            dv->devname, strerror(errno));
        if (sysfd >= 0)
            close(sysfd);
        goto abort;
    }
    if (sysfd >= 0)
        close(sysfd);
    sysfd = -1;
    count++;
    if (verbose >= 0)
        pr_err("set %s faulty in %s\n",
            dv->devname, devname);
    break;

请注意，调用write(sysfd, "faulty", 6). sysfd是文件中先前设置的变量：
sysfd = sysfs_open(fd2devnm(fd), dname, "block/dev");

sysfs_open()是一个函数这个文件：

int sysfs_open(char *devnm, char *devname, char *attr)
{
    char fname[50];
    int fd;

    sprintf(fname, "/sys/block/%s/md/", devnm);
    if (devname) {
        strcat(fname, devname);
        strcat(fname, "/");
    }
    strcat(fname, attr);
    fd = open(fname, O_RDWR);
    if (fd < 0 && errno == EACCES)
        fd = open(fname, O_RDONLY);
    return fd;
}

如果你跟踪这些功能，你会发现它mdadm /dev/md0 -f /dev/sdb1本质上是这样做的：

echo "faulty" > /sys/block/md0/md/dev-sdb1/block/dev

/dev/md0由于被阻止，该请求将处于等待状态并且不会立即通过。

3. 是否可以配置超时以便`md`自动使不响应 ATA 命令的驱动器失效？

是的。事实上，默认情况下，超时时间为 30 秒：

root@node51 [~]# cat /sys/block/sdb/device/timeout
30

您的假设存在问题，因为您的驱动器实际上正忙于运行 ATA 命令（持续 188 分钟），因此并没有超时。

有关详情，请参阅Linux 内核 SCSI 错误处理文档。

4. 为什么要`md`继续使用含有无效数据的设备？

当 ATA 安全擦除完成时，驱动器未报告任何问题，例如中止命令，因此md没有理由怀疑存在问题。

此外，在您使用分区作为 RAID 设备而不是整个磁盘的情况下，内核的内存分区表并未被告知擦除驱动器上的分区已消失，因此md会继续访问，/dev/sdb1就像没有任何问题一样。

这是来自md手册页：

清理和不匹配

由于存储设备随时可能出现坏块，因此定期读取阵列中所有设备上的所有块以尽早捕获此类坏块非常有价值。此过程称为擦洗。

可以通过以下方式擦除 md 数组：查看或者维修到文件md/sync_action在里面系统文件系统设备的目录。

请求清除将导致 md 读取阵列中每个设备的每个块，并检查数据是否一致。对于 RAID1 和 RAID10，这意味着检查副本是否相同。对于 RAID4、RAID5、RAID6，这意味着检查奇偶校验块（或多个块）是否正确。

由此我们可以推断，通常不会在每次磁盘读取时检查奇偶校验。（此外，每次读取时都检查奇偶校验会增加完成读取所需的事务量，并运行奇偶校验与数据读取的比较，这将严重影响性能。）

在正常运行下，md只是假设它读取的数据是有效的，因此很容易受到静默数据损坏。就你的情况而言，由于你擦除了驱动器，所以整个驱动器上的数据都被悄无声息地损坏了。

您的文件系统没有意识到损坏。您在文件系统级别看到输入/输出错误，因为文件系统无法理解为什么它有坏数据。

为了避免静默数据损坏，首先，永远不要再做你做过的事.其次，考虑使用虚拟文件系统，一种专注于数据完整性并检测和纠正静默数据损坏的文件系统。

Answer 1

德尔蒂克，您误解了 Linux 软件 RAID（md）的工作原理。

md由多个设备或分区构成虚拟块设备，并且不知道您正在向虚拟设备传输什么数据。
您希望它能够完成它没有被设计做的事情。

答案

`md`1. 为什么无响应的驱动器/分区不会失败？

这是因为md不知道

驱动器正忙于处理其md自身请求的 I/O 或
由于某些外部情况（如驱动器自身的错误恢复或 ATA 安全擦除），驱动器被阻止，

因此md将等待驱动器返回什么。驱动器最终没有返回任何读取或写入错误。如果存在读取错误，md则会自动从奇偶校验中修复它，如果存在写入错误，md则会导致设备故障（请参阅md手册页）。

由于没有读取错误也没有写入错误，因此md内核等待其响应后继续使用该设备。

2. 当驱动器被阻止时，我可以从阵列中删除驱动器/分区吗？

不可以。RAID/dev/md0设备已被阻止，除非清除阻止，否则无法修改。

您已将-f或--fail标志传递给mdadm“管理”模式。
以下是其实际作用的演示：

这是该标志工作原理的源代码：

case 'f': /* set faulty */
    /* FIXME check current member */
    if ((sysfd >= 0 && write(sysfd, "faulty", 6) != 6) ||
        (sysfd < 0 && ioctl(fd, SET_DISK_FAULTY,
                rdev))) {
        if (errno == EBUSY)
            busy = 1;
        pr_err("set device faulty failed for %s:  %s\n",
            dv->devname, strerror(errno));
        if (sysfd >= 0)
            close(sysfd);
        goto abort;
    }
    if (sysfd >= 0)
        close(sysfd);
    sysfd = -1;
    count++;
    if (verbose >= 0)
        pr_err("set %s faulty in %s\n",
            dv->devname, devname);
    break;

请注意，调用write(sysfd, "faulty", 6). sysfd是文件中先前设置的变量：
sysfd = sysfs_open(fd2devnm(fd), dname, "block/dev");

sysfs_open()是一个函数这个文件：

int sysfs_open(char *devnm, char *devname, char *attr)
{
    char fname[50];
    int fd;

    sprintf(fname, "/sys/block/%s/md/", devnm);
    if (devname) {
        strcat(fname, devname);
        strcat(fname, "/");
    }
    strcat(fname, attr);
    fd = open(fname, O_RDWR);
    if (fd < 0 && errno == EACCES)
        fd = open(fname, O_RDONLY);
    return fd;
}

如果你跟踪这些功能，你会发现它mdadm /dev/md0 -f /dev/sdb1本质上是这样做的：

echo "faulty" > /sys/block/md0/md/dev-sdb1/block/dev

/dev/md0由于被阻止，该请求将处于等待状态并且不会立即通过。

3. 是否可以配置超时以便`md`自动使不响应 ATA 命令的驱动器失效？

是的。事实上，默认情况下，超时时间为 30 秒：

root@node51 [~]# cat /sys/block/sdb/device/timeout
30

您的假设存在问题，因为您的驱动器实际上正忙于运行 ATA 命令（持续 188 分钟），因此并没有超时。

有关详情，请参阅Linux 内核 SCSI 错误处理文档。

4. 为什么要`md`继续使用含有无效数据的设备？

当 ATA 安全擦除完成时，驱动器未报告任何问题，例如中止命令，因此md没有理由怀疑存在问题。

此外，在您使用分区作为 RAID 设备而不是整个磁盘的情况下，内核的内存分区表并未被告知擦除驱动器上的分区已消失，因此md会继续访问，/dev/sdb1就像没有任何问题一样。

这是来自md手册页：

清理和不匹配

由于存储设备随时可能出现坏块，因此定期读取阵列中所有设备上的所有块以尽早捕获此类坏块非常有价值。此过程称为擦洗。

可以通过以下方式擦除 md 数组：查看或者维修到文件md/sync_action在里面系统文件系统设备的目录。

请求清除将导致 md 读取阵列中每个设备的每个块，并检查数据是否一致。对于 RAID1 和 RAID10，这意味着检查副本是否相同。对于 RAID4、RAID5、RAID6，这意味着检查奇偶校验块（或多个块）是否正确。

由此我们可以推断，通常不会在每次磁盘读取时检查奇偶校验。（此外，每次读取时都检查奇偶校验会增加完成读取所需的事务量，并运行奇偶校验与数据读取的比较，这将严重影响性能。）

在正常运行下，md只是假设它读取的数据是有效的，因此很容易受到静默数据损坏。就你的情况而言，由于你擦除了驱动器，所以整个驱动器上的数据都被悄无声息地损坏了。

您的文件系统没有意识到损坏。您在文件系统级别看到输入/输出错误，因为文件系统无法理解为什么它有坏数据。

为了避免静默数据损坏，首先，永远不要再做你做过的事.其次，考虑使用虚拟文件系统，一种专注于数据完整性并检测和纠正静默数据损坏的文件系统。

当 ATA 停止响应时，md RAID 中的设备发生故障

警告

问题

答案1

答案

`md`1. 为什么无响应的驱动器/分区不会失败？

2. 当驱动器被阻止时，我可以从阵列中删除驱动器/分区吗？

3. 是否可以配置超时以便`md`自动使不响应 ATA 命令的驱动器失效？

4. 为什么要`md`继续使用含有无效数据的设备？

清理和不匹配

相关内容

警告

问题

答案1

答案

md1. 为什么无响应的驱动器/分区不会失败？

2. 当驱动器被阻止时，我可以从阵列中删除驱动器/分区吗？

3. 是否可以配置超时以便md自动使不响应 ATA 命令的驱动器失效？

4. 为什么要md继续使用含有无效数据的设备？

清理和不匹配

相关内容

`md`1. 为什么无响应的驱动器/分区不会失败？

3. 是否可以配置超时以便`md`自动使不响应 ATA 命令的驱动器失效？

4. 为什么要`md`继续使用含有无效数据的设备？