设置

Question

长话短说sh->sector 是数据段开始后物理磁盘中的扇区数

设置

这是一个简单的测试设置来说明：

/dev/raidme/rd[0-3]，2GB 设备
/dev/md127 在这 5 个上创建为 raid5，初始化为 xfs 并填充随机数据

现在开始，获取一个非零块并覆盖它

# dd if=/dev/raidme/rd0 bs=1k count=1 skip=10240 | hexdump -C | head
...
# dd if=/dev/zero of=/dev/raidme/rd0 bs=1k count=1 seek=10240
...
# dd if=/dev/raidme/rd2 bs=1k count=1 skip=10240 | hexdump  -C | head
1024 bytes (1.0 kB, 1.0 KiB) copied, 8.6021e-05 s, 11.9 MB/s
00000000  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
00000400

确保通过停止/重组阵列刷新 dm/md 缓存，并检查：

# mdadm --stop /dev/md127
# mdadm --assemble /dev/md127 /dev/raidme/rd*
# echo check > /sys/class/block/md127/md/sync_action
# dmesg | tail
...
[ 1188.057900] md/raid:md127: check found mismatch at sector 16384

磁盘上的块

好的，首先让我们检查 16384 是否与我们编写的内容相符。我的 raid 有一个 512k 条带，所以我确保我写了一些对齐的东西以便于匹配，我们在1024*10240ie上写道0xa00000。

您的补丁提供了 info 16384，需要注意的一件事是数据不是从 0 开始：

# mdadm -E /dev/raidme/rd0 | grep "Data Offset"
    Data Offset : 4096 sectors

如此printf "%x\n" $(((4096+16384)*512))说0xa00000也罢。好的。

md 中的块

现在要获取 md 端的位置，实际上更容易：它只是以扇区时间给出的位置number_of_stripes，例如对我来说，我有 4 个磁盘 (3+1)，所以有 3 个条带。

在这里，它的意思是16384*3*512例如0x1800000。我很好地填充了磁盘，因此只需读取磁盘并查找 1k 个零即可轻松检查：

# dd if=/dev/md127 bs=1M | hexdump -C | grep -C 3 '00 00 00 00 00 00'
... some false positives...
01800000  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
01800400  6b a8 9e e0 ad 88 a8 de  dd 2e 68 00 d8 7a a3 52  |k.........h..z.R|

xfs 中的块

凉爽的。现在让我们看看它在 xfs 中的位置。16384*3是49152（daddr 取扇区号）：

# xfs_db -r /dev/md127
xfs_db> blockget -n
xfs_db> daddr 49152
xfs_db> blockuse -n
block 6144 (0/6144) type data inode 2052 d.1/f.1

毫无疑问，零位于该文件中：

# dd if=/mnt/d.1/f.1 bs=1M | hexdump -C | grep -C 3 '00 00 00 00 00'
...
03680000  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
03680400  6b a8 9e e0 ad 88 a8 de  dd 2e 68 00 d8 7a a3 52  |k.........h..z.R|

如果我们覆盖该文件，/dev/raidme/rd0 中正确的偏移量处的零也会消失（只需将其与另一个文件一起添加）。如果您再次写入 /dev/raidme/rd0 （确保再次停止/启动阵列），那么零就会回来。看起来不错。

不过，还有一个问题，如果您的条带大小与我的条带大小一样大（512k），那么我们没有一个块需要处理，只有 1.5MB 的可能数据已损坏......通常情况下，这会出现在一个单个文件，但您需要返回 xfs_db 进行检查。记住之前的 inode 是 2052。

xfs_db> inode 2052
xfs_db> bmap
data offset 0 startblock 256 (0/256) count 17536 flag 0
data offset 17536 startblock 122880 (0/122880) count 4992 flag 0
data offset 22528 startblock 91136 (0/91136) count 3072 flag 0

这里一个块的大小为 4096 字节（参见参考资料xfs_info），因此我们的 1.5MB 是 384 个块。我们损坏的段是块 6144 到 6528 - 正好位于该文件的第一段内。

其他需要注意的事情是手动提取块并检查校验和不匹配的确切位置，这有望为您提供 3 个较小的块来查看。

最后关于你的补丁，我自己不是 md 开发人员，但作为前 mdadm raid5 用户，我会非常感兴趣。我想说，花一点力气绝对值得。你提到的清理可能很有用，我相信一旦你提交补丁，开发人员就会有一些评论，但是MD需要对这些错误更加详细！

Answer 1

长话短说sh->sector 是数据段开始后物理磁盘中的扇区数

设置

这是一个简单的测试设置来说明：

/dev/raidme/rd[0-3]，2GB 设备
/dev/md127 在这 5 个上创建为 raid5，初始化为 xfs 并填充随机数据

现在开始，获取一个非零块并覆盖它

# dd if=/dev/raidme/rd0 bs=1k count=1 skip=10240 | hexdump -C | head
...
# dd if=/dev/zero of=/dev/raidme/rd0 bs=1k count=1 seek=10240
...
# dd if=/dev/raidme/rd2 bs=1k count=1 skip=10240 | hexdump  -C | head
1024 bytes (1.0 kB, 1.0 KiB) copied, 8.6021e-05 s, 11.9 MB/s
00000000  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
00000400

确保通过停止/重组阵列刷新 dm/md 缓存，并检查：

# mdadm --stop /dev/md127
# mdadm --assemble /dev/md127 /dev/raidme/rd*
# echo check > /sys/class/block/md127/md/sync_action
# dmesg | tail
...
[ 1188.057900] md/raid:md127: check found mismatch at sector 16384

磁盘上的块

好的，首先让我们检查 16384 是否与我们编写的内容相符。我的 raid 有一个 512k 条带，所以我确保我写了一些对齐的东西以便于匹配，我们在1024*10240ie上写道0xa00000。

您的补丁提供了 info 16384，需要注意的一件事是数据不是从 0 开始：

# mdadm -E /dev/raidme/rd0 | grep "Data Offset"
    Data Offset : 4096 sectors

如此printf "%x\n" $(((4096+16384)*512))说0xa00000也罢。好的。

md 中的块

现在要获取 md 端的位置，实际上更容易：它只是以扇区时间给出的位置number_of_stripes，例如对我来说，我有 4 个磁盘 (3+1)，所以有 3 个条带。

在这里，它的意思是16384*3*512例如0x1800000。我很好地填充了磁盘，因此只需读取磁盘并查找 1k 个零即可轻松检查：

# dd if=/dev/md127 bs=1M | hexdump -C | grep -C 3 '00 00 00 00 00 00'
... some false positives...
01800000  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
01800400  6b a8 9e e0 ad 88 a8 de  dd 2e 68 00 d8 7a a3 52  |k.........h..z.R|

xfs 中的块

凉爽的。现在让我们看看它在 xfs 中的位置。16384*3是49152（daddr 取扇区号）：

# xfs_db -r /dev/md127
xfs_db> blockget -n
xfs_db> daddr 49152
xfs_db> blockuse -n
block 6144 (0/6144) type data inode 2052 d.1/f.1

毫无疑问，零位于该文件中：

# dd if=/mnt/d.1/f.1 bs=1M | hexdump -C | grep -C 3 '00 00 00 00 00'
...
03680000  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|
*
03680400  6b a8 9e e0 ad 88 a8 de  dd 2e 68 00 d8 7a a3 52  |k.........h..z.R|

如果我们覆盖该文件，/dev/raidme/rd0 中正确的偏移量处的零也会消失（只需将其与另一个文件一起添加）。如果您再次写入 /dev/raidme/rd0 （确保再次停止/启动阵列），那么零就会回来。看起来不错。

不过，还有一个问题，如果您的条带大小与我的条带大小一样大（512k），那么我们没有一个块需要处理，只有 1.5MB 的可能数据已损坏......通常情况下，这会出现在一个单个文件，但您需要返回 xfs_db 进行检查。记住之前的 inode 是 2052。

xfs_db> inode 2052
xfs_db> bmap
data offset 0 startblock 256 (0/256) count 17536 flag 0
data offset 17536 startblock 122880 (0/122880) count 4992 flag 0
data offset 22528 startblock 91136 (0/91136) count 3072 flag 0

这里一个块的大小为 4096 字节（参见参考资料xfs_info），因此我们的 1.5MB 是 384 个块。我们损坏的段是块 6144 到 6528 - 正好位于该文件的第一段内。

其他需要注意的事情是手动提取块并检查校验和不匹配的确切位置，这有望为您提供 3 个较小的块来查看。

最后关于你的补丁，我自己不是 md 开发人员，但作为前 mdadm raid5 用户，我会非常感兴趣。我想说，花一点力气绝对值得。你提到的清理可能很有用，我相信一旦你提交补丁，开发人员就会有一些评论，但是MD需要对这些错误更加详细！

设置

内核补丁添加日志记录

线性扇区到 XFS 文件名：

关于我的设置的额外内容，这里没什么重要的

答案1

设置

磁盘上的块

md 中的块

xfs 中的块

相关内容