我如何才能找到 ext3 文件系统损坏的原因？

Question 1

这里有一份关于 HP EVA 的 KB，特别是如果您使用的是 Round Robin PSP。首先，您应该检查 vmkernel.log 以检查是否存在存储错误。相关知识库条目 (pdf)

为了优化 EVA 阵列性能，HP 建议将默认的循环负载平衡 IOPS 值更改为 1。必须在 ESX4.x 上使用以下命令对每个 Vdisk 执行此更新：

esxcli nmp roundrobin setconfig -t iops -I 1 -d naa.xxxxxxxxx

对于 ESXi5：

for i in `esxcli storage nmp device list | grep naa.600` ; do esxcli storage nmp psp roundrobin deviceconfig set -t iops –I 1 -device $i; done

Answer

这里有一份关于 HP EVA 的 KB，特别是如果您使用的是 Round Robin PSP。首先，您应该检查 vmkernel.log 以检查是否存在存储错误。相关知识库条目 (pdf)

为了优化 EVA 阵列性能，HP 建议将默认的循环负载平衡 IOPS 值更改为 1。必须在 ESX4.x 上使用以下命令对每个 Vdisk 执行此更新：

esxcli nmp roundrobin setconfig -t iops -I 1 -d naa.xxxxxxxxx

对于 ESXi5：

for i in `esxcli storage nmp device list | grep naa.600` ; do esxcli storage nmp psp roundrobin deviceconfig set -t iops –I 1 -device $i; done

Question 2

如果问题仅在您将数据从一台服务器同步到另一台服务器时才会重现，则意味着问题与从内核的角度来看数据一致性的方式有关。如果内核认为文件系统即将损坏或已经损坏，它将把文件系统变为只读。

我对 HP EVA 不太了解，但它是否有电池支持的写入缓存。如果有，您可以禁用磁盘写入缓存并使用 SAN 阵列写入缓存吗？为此，使用 mount -o barrier=1 进行安装，看看是否看到任何改进。

我有一种直觉，认为这与存储有关，而不是任何文件系统故障。我不确定如何证明这一点，但我见过的大多数有关文件系统损坏的案例都以某种方式或某种方式涉及存储作为罪魁祸首，如果不是主要原因的话。

Answer

如果问题仅在您将数据从一台服务器同步到另一台服务器时才会重现，则意味着问题与从内核的角度来看数据一致性的方式有关。如果内核认为文件系统即将损坏或已经损坏，它将把文件系统变为只读。

我对 HP EVA 不太了解，但它是否有电池支持的写入缓存。如果有，您可以禁用磁盘写入缓存并使用 SAN 阵列写入缓存吗？为此，使用 mount -o barrier=1 进行安装，看看是否看到任何改进。

我有一种直觉，认为这与存储有关，而不是任何文件系统故障。我不确定如何证明这一点，但我见过的大多数有关文件系统损坏的案例都以某种方式或某种方式涉及存储作为罪魁祸首，如果不是主要原因的话。

相关内容